in between days

表参道で働くシニアのブログ

話題のパクりサイト redo.me.uk について気づいたいくつかのこと。MODxはパクツイbotの夢を見るか?

今週の頭からredo.me.ukっていう全文パクリサイトがちょっと話題になっているみたい。例えばこのあたり。

http://internet.watch.impress.co.jp/docs/yajiuma/20150713_711323.html

全文パクリとおもいきや、実はごっついファイヤーウォールの中から外部のサイトを見るための汎用プロキシみたいなこともあるし、きになったのでちょっと調べてみた。

redo.me.ukってなに?

Googleで期間を指定して検索すると、今週にはいって日本で騒がれてるだけで、それまで世界中の誰にも言及されてないっていうかなり過疎ったサイトみたい。

それでひたすら過去をたどってみたら、2008年12月にこんなログが残ってた。redo.me.ukローンチのお知らせだ。

irberry, 6 years, 7 months ago
Hello people

I have just launched my latest Modx creation, redo.me.uk. It’s the usual URL miniaturisation but with an optional twist.

During my time playing I’ve made myself chuckle a few time. Example http://redo.me.uk/ig7co

I hope you like it and I look forward to any feedback.

Thanks
Ian

Redo.me.uk - URL miniaturisation with a twist - Just Launched! | MODX Community Forums

Ian(irberry)なる人物がなにものかは、クリックするとMODxフォーラムへのログインを求められるのでそれ以上は追ってないけど、すごい無邪気な投稿なのがおもしろい。

それにしてもMODxとはなかなか懐かしいかんじがする(現役でユーザーの方がいたらすいません)。PHPで書かれたCMS。2000年代っぽい。

サイトトップのサイドバーに貼られてるredo.me.uk/s84dy/news.bbc.co.ukにアクセスすると、MODxがパースエラーを吐くので、redo.me.ukがMODxでできてるってのはたぶんマジなんだろう。

さて、この書き込みがホントにいま話題になってるredo.me.ukローンチのお知らせだとしたら、言われてるほど悪意があるサイトではなく、もっと無邪気で、雑な(そしてたぶんいろいろ行儀の悪いところもある)サイトなんじゃないだろうか。

日本のサイトをクロールしてるって言われてるけど、そんな機能あるかなあ。ただ突っ込まれたURLをリダイレクト(さらにキャッシュも?)するしかできそうにないけど???

なんで日本のサイトがキャッシュされてんのか?? に関する仮説

クロールしてないとすれば、キャッシュされてる日本のサイトがたくさんあるのはなぜ? という疑問が残る。それでTwitterでredo.me.ukを検索して、ひたすらさかのぼっていったら、こんな検索結果になった。

これってパクツイbotなのかな?? でも、いったいなんでこの検索結果に???

どうやら、パクツイbotが貼ってる短縮URLを展開すると、さらにリダイレクタを何重にかけていて、その過程でredo.me.ukに飛ばしてるっぽい。

例えば、検索結果で最初に出てくるパクツイ系のツイートは今年5月のこれで

このリンクをクリックすると、こういうURLに飛ばされるようだ。

http://longurl.org/expand?url=http%3A%2F%2Ft.co%2F3FsWoyjz7U

https://www.google.com/url?rct=j&sa=t&url=http%3A%2F%2Fredo.me.uk%2Focxbn%2Fmerry-news.com%2Ffeed%2F1019583%2F&ct=ga&cd=CAIyHDJhMjgyZDNhMjcyOGU2YzE6Y28uanA6amE6SlA&usg=AFQjCNErN8FV3Sxi7RPZ_xGjsAawW34Krw&utm_source=dlvr.it&utm_medium=twitter

これって、Googleのリダイレクタを介してredo.me.ukに飛ばしてるってことだよね?

こうやってパクツイbotが日本中の話題になったリンクをせっせとredo.me.ukに飛ばし続けてるので、日本のいろんなサイトがredo.me.ukにどんどんキャッシュされてってる、という仮説なんだけど、どうだろう?

ざっくり見てみただけなので、もっと技術的にしっかりしたひとが調べてもらえると嬉しいです。あと2008年に立てたリダレクターとか放っておくと予想もしなかった形で悪用されることあるね、という知見がえられた。