エロゲの新作を自動で収集するアフィサイトを作ってみた

エロゲの新作をまとめているアフィサイトをよく見かけることがあったので、何番煎じなのか分かりませんが自分でも作ってみようと思いました。

思い立ったら即行動!ということで、ドメイン取得から1週間程度でざっくりと作りました!

https://new-game.site

えろくてにゅーげーむ

強くてニューゲームをもじったサイト名ですねw

ポイントは完全自動化です。

新作を毎日チェックして手動で更新するなんてとても無理ゲーですので。

というか、自動化サイトを作りたい!という理由で作ったと言っても過言ではありませんw

まぁ、単なる趣味レベルのサイトですw

収集サイトは以下の3つ

・FANZA(API)
・DLsite(スクレイピング)
・Getchu(スクレイピング)

FANZAはAPIが用意されているので楽ちんです。

DLsiteとGetchuはサイトに負担をかけないようにスクレイピングします。

1日1回各サイトから情報を収集して、WPの記事を追加または更新されるようにしました。

以下、残作業と課題。

●残作業

  • シナリオ、イラストの担当者名を定期収集
  • TOPページの改良
  • サイトデザインの変更
  • アフィリエイト申請

●課題

【集客とSEO】

オリジナルコンテンツもなく、特段狙えるキーワードもなく、検索エンジンからの集客が望めない/(^o^)\

それ以前に、個別記事はほぼインデックスされないと思われる。

アーカイブページで「○○年○○月 エロゲ」あたりのキーワードは拾えるかもしれないが、検索ボリュームがクッソ低い。


かと言ってTwitterでの集客もイメージが沸かない。。。

何かしらのSEO対策をしていく必要がある。

●所感

DLsiteは予約販売作品がほとんどない・・・

Getchuの画像はドメイン外からのアクセスに制限をかけている。アフィのために用意されている画像は問題なし。


今後の更新情報はこのページに追記していきます。

質問等ありましたらコメントにどうぞ(´・ω・`)

更新ログ

シナリオ、イラストの担当者名の収集bot作成(2022/04/02)

絵師の好みで作品を購入する人もいるし、シナリオが好きで購入する人もいる!

ということで、この2つを早めに埋めておきたかったので、収集するbotを作成しました。

定期的(30分に一回)にこの2つがブランクになっている記事をひとつピックアップして、対象の作品ページをスクレイピングします。

FANZAもDLsiteもげっちゅ屋もシナリオやイラストの要素にclassもIDも振っていないので、スクレイピングがくっそ面倒だったw

TOPとデザインを若干修正(2022/04/04)

TOPページに追加エロゲ作品のログを表示するようにしました。

訪問者は発売が発表されたばかりの新作をチェックできる、そして自分はちゃんとbotが稼働して作品を収集していることを確認できる、一石二鳥の役割です。

あと、若干デザインを変更しました。フォントを変えたりテーマカラーを入れたり・・・

ヘッダのイラストが欲しいかな(´・ω・`)

mixhostのサーバー障害によりテンプレ崩壊(2022/10/26)

利用していたレンタルサーバーmixhostでサーバー障害が発生しました。

mixhost側の対応として、障害のあったサーバーから新サーバーへの移管が行われたのですが、その時にcocoonのテーマファイルが消失しました。

正しくはcocoonテーマのtmpフォルダ内が、mixhost側でバックアップが取られておらず、中身がまっさらの状態になって復元されてしまいました。

完全にmixhostの過失なのですが、ないものはないのでどうしようもない。。。

かなりいじくりまわしていたのでもう一度作り直すのはかなり難儀・・・というか面倒くさすぎる。

というわけで、しばらく放置します(´・ω・`)

インデックスとアクセス状況

2022年4月4日のインデックス状況はこんな感じ。

除外304件(*´Д`)

すべてのページが「検出 – インデックス未登録」の状態。

この304はサイトマップで送信されたページの数と一致しています。

これは「Googleとしてはサイトマップによって304ページ存在していることを認知しましたが、クローラーはまだ巡回していません」という意味になります。

まぁどこからもリンクが貼られていませんので、クロールしてくれていないのは当然ではあります。

というわけで、自サイトからある程度リンクを貼り付けて、クローラーを促してみることにしました。

しばらく様子見をしてインデックスに変化があるかをチェックしていきたいと思います。

ただ「クロール済み – インデックス未登録」に変わるだけの可能性が高いw

コメント

タイトルとURLをコピーしました