Wikipedia:井戸端/subj/Archive.isをスパムサイトとして外部リンクに不適とする提案

Archive.isをスパムサイトとして外部リンクに不適とする提案。[編集]

この数ヶ月でArchive.isで保存れていないURLに飛ぶとマルウェアが仕掛けられている可能性があり、Windows10では危険エラーでシャットダウンするぐらいの警告となっているために、Wikipedia:外部リンクの選び方#禁止される外部リンクから適応しているかが疑問となっています。まだ、スパム・ブラックリストにはなっていないみたいですが危険性は高いです。 また、アーカイブ自体が日本国内法の著作権法第32条の2(引用)および第47条の7(情報解析のための複製等)2016年9月14日におけるWaybackのアーカイブ)に適応したものを目的としてために違法ではないと考えています。しかし、Archive.isでしか出来ない「robots.txt」エラーサイトの保存についても、他のアーカイブサイトで保存拒否を示している事は著作権の違反も兼ねているのではないでしょうか。

過去の論義には、

がありますがArchive.isについては3年前の事しかなく、改めて議論したい所であります。ご意見をお願いします。--水瀬悠志会話2016年11月5日 (土) 05:53 (UTC)[返信]

コメント こんにちは。私の環境(Win10 x64; Vivaldi 1.5)ではそんなことにはならないのですが、具体的なURLとブラウザを教えていただいてもよろしいでしょうか?--Waiesu会話2016年11月5日 (土) 06:49 (UTC)[返信]
Waiesu PC環境はWin10 x64;Google Chromeの2016年9月時点での最新版の54版代です。現在は収まったのでしょうか。ただ、著作権の問題については少し疑問を感じていますし、ZIP保存が出来る地点でウィルスも保存出来てしまう危険性はあります。Archive.isサイト内リダイレクトで全く別のURLに飛んでしまったので、Windows10のセキュリティ警告が出て、PDFで日本の03で始まるマイクロソフトの電話番号を保存を促す問い合わせ要求が出てしまっていました。マイクロソフトとは関係ない電話番号と言う参照ページもあったのでマルウェアな可能性があり、ご意見したまでです。--水瀬悠志会話2016年11月5日 (土) 08:19 (UTC)[返信]
コメント 短縮URLによってアーカイブされたページがスパムかどうか判別できない、という理由でしたら、反対します。短縮URLすべてを不適切とするならばいいですが、archive.isはURL短縮サイトではないですし、本来のURLhttps://archive.is/タイムスタンプ/アーカイブされたURLを制限する必要がないからです。出典系テンプレートのarchiveurlとの整合性もとれません。著作権についても問題ないと思います。--Waiesu会話2016年11月5日 (土) 11:56 (UTC)[返信]
Waiesu 単純に短縮URLと言うだけでなく、一時期はマルウェア認識が一部のセキュリティでなされている事も御座います。下記のサブアカウントのarchive.liについても加味した上でお願いします。--水瀬悠志会話2016年11月5日 (土) 14:05 (UTC)[返信]
また、en.wikipediaでは短縮URLの危険性もあり、削除BOT処置(英文)をしている経緯もあります。一方で日本語版(ja.wikipedia)と中国語版(zh.wikipedia)ではブロックもなく反映されています。また、一時期はサブアカウントであるarchive.liがマルウェアサイト(ドイツ語)とSophos・Fortinet・Google Safebrowsingが認識していた故かもしれません。ハッカーによりマルウェアサイト認識が再発するの可能性もあるための提案とも言えます。--水瀬悠志会話2016年11月5日 (土) 08:49 (UTC)[返信]
どこかの姉妹プロジェクトで archive.is を悪用して spam をばらまきまくるという事態が発生し、対処に追われた経験がありますので提案に対して賛成します。--rxy会話2016年11月5日 (土) 09:16 (UTC)[返信]
取り敢えずのまとめとしては、著作での問題なし。やはり、今後もスパム・マルウェアが仕掛けられる可能性での問題となりますね。引き続きスパムやマルウェアが仕掛けられる傾向での意見をお願いします。署名時点ではarchive.is、archive.li、archive.foをVirusTotalで調べた所、マルウェアはありませんでしたが。--水瀬悠志会話2016年11月6日 (日) 02:49 (UTC)[返信]
OCNでのマルウェア不正通信ブロックサービスにおけるマルウェア通信検知日時ですが、「gifu.gifu.ocn.ne.jp」のIPにて不正の通信を遮断され、「2016年7月22日 07:12:58」に記録があると言う事です。その期間にマルウェアが仕掛けられていた可能性が高いです。それからISP側の対処報告をメール送信ユーザー通知されたのは「2016年8月16日, 15:43」にありました。その間に archive.is を多頻度で利用していたので参考にして下さい。それ以降はセキュリティー上の警戒をして試験的な保存でしかしていません。また、この期間はWayback Machineでも504 Gate wayエラーも頻発していました。Google ChromeのCookie消去で多少は解消していますが、たまに保存ページが多いと504エラーは出ていますので因果関係が確証は出来ていません。また、Avast Antivirusマカフィー アンチウイルスでのスキャンでPC側には影響はなかったです。--水瀬悠志会話2016年11月6日 (日) 12:30 (UTC)[返信]
「削除BOT処置」とは何のことですか?提示済みのリンク[1]先には「archive.is」という文字はありませんが。参考のためそのBot名を教えていただけますか? --210.149.252.192 2016年11月7日 (月) 12:11 (UTC)[返信]
「どこかの姉妹プロジェクト」とはどこですか?参考のため具体的な被害を受けた場所のURLをいただけますか? --210.149.252.192 2016年11月7日 (月) 12:11 (UTC)[返信]
「削除BOT処置」には誤解があったみたいです。そこは言語能力に限界があった様なので失礼しました。ただ、先の通りに2016年7月にはOCNでのマルウェアによる対処があったのは確かだったのですが、Google Chromeに限った事なんでしょうか。他ブラウザでの報告があればお願いします。--水瀬悠志会話2016年11月8日 (火) 03:44 (UTC)[返信]
en.wikipediaにおいて、別ページと勘違いしていたので訂正します。ブラックリストのCOIBotレポート(英文)によると、外部リンクは同じものでないといけないとあり、短縮URLでは確証が持てない点があると言う事です。あと、Archive.isについてのRFC(英文)でも運用側に信用問題があるともあります。確かに archive.is が著作上で問題がない以上は他アーカイブで保存出来ないサイトもありますし完全排除するのは心苦しい事ではあります。しかし、実際に一時期ではあれ、先述通りにスパム・マルウェア検出してしまった経緯もありますので、こんな経緯に至ってしまった訳です。--水瀬悠志会話2016年11月8日 (火) 12:42 (UTC)[返信]
このままですと、スパムやマルウェアの面でも議論がお流れになりそうですね。Googleセキュリティーの誤検知と言う解釈なのでしょうか。取り敢えず、著作に問題がない限りは「robots.txt」エラーが出るサイトだけに archive.is の保存・リンクに留めて置くことは推奨します。--水瀬悠志会話2016年11月14日 (月) 11:11 (UTC)[返信]
短縮URLを非推奨とする話は続けるべきではないでしょうか。archive.isに限っていえば、既に上で挙げられているようにlong urlを使う方法や、short urlでもスクリーンショットへのリンクとする方法があります。首相官邸ホームページを例にとると・・・long url「http://archive.is/2016.11.14-121429/http://www.kantei.go.jp/」、short url+image「https://archive.is/RCMgy/image」のように記せるのでうっかり危険なサイトに飛んでしまう心配は軽減されると思います。--Bellis会話2016年11月14日 (月) 12:29 (UTC)[返信]
(短縮URLを非推奨に賛成)確かに署名時点でスパムやマルウェアが確認出来ない以上、予防策としては有効性があります。--水瀬悠志会話2016年11月15日 (火) 17:53 (UTC)[返信]
(補足) en.wikipediaの件などでも前述していますが、Bellis様が提示しているアーカイブリンクの示し方やWayback Machineの様なアーカイブURLみたいにオリジナルとなるURLを分かる必要はあります。これによりウィルスEXEファイルや同じウィルスが入っているZIP等の圧縮ファイルやマルウェアやスパムありの危険サイトへの誘導を防ぐためです。そのために短縮URLを非推奨とし、オリジナルだと判別出来るアーカイブリンクにすべきと言う考えを加えて賛成とします。--水瀬悠志会話2016年11月17日 (木) 15:41 (UTC)[返信]

今更ながら、タイトルで「Archive.is」のスペルを間違えていました。気づくのが遅くて申し訳ないです。署名時点で言える事は「著作に問題ない範囲」と「非短縮のオリジナルURLがある表記」で記述を推奨する事でお願いします。タイトルについても直せる方が居れば、よろしくお願いします。--水瀬悠志会話2016年11月22日 (火) 12:55 (UTC)[返信]

あと、long linkは署名時点では「シェア」からURLは拾えます。オリジナルURLのアーカイブと判るようにするためにもブラウザの表示されている短縮URLは使用しない様にお願いします。--水瀬悠志会話2016年11月26日 (土) 10:59 (UTC)[返信]