DLsiteとFANZAの同人音声作品を題材とした探索的データ解析

はじめに

(注意: この記事はいたってまじめな内容ですが、取り扱っている分野ゆえアダルトな表現やサービスへのリンク等が含まれます。気を付けてね!)

 

同人音声とは、個人あるいは小規模な団体によって製作される音声作品のことです。

ネット販売の普及で個人が手軽に参入できるようになってからの同人作品市場の発達は、目を見張るものがあります。同人音声もその例に漏れず、発表作品の量・質ともに向上を続けています。

 

ところで、アダルトコンテンツのデータ解析はいろいろなところで行われており、例えばPornHubはPornHub Insightsで様々な面白い調査を公開しています。

例えば、下はハロウィン期間中の検索ワードやトラフィックの変化とかの可視化。インフォグラフィックとしてめちゃくちゃ見やすいので、おすすめです。

www.pornhub.com

 

日本では、2018年に公開されたFANZA REPORT 2018 同人編」が有名です。FANZA同人に訪れたユーザー約1億4000万人の調査が行われ、「寝取り・寝取られ」が圧倒的人気ジャンルであることが一部界隈で話題となったりしました。

special.dmm.co.jp

 

これらの調査は訪問ユーザーを対象としたものが中心ですが、コンテンツの供給側(同人サークル)を対象として、作品のダウンロード数に注目した調査はこれまでに行われてきませんでした(たぶん)。

そこで本記事では、FANZAおよびDLsiteで販売されている同人音声の探索的データ解析(EDA)を行います。

素人のお遊びですが、お楽しみいただければ幸いです。

 

 

わかったことを3行で

  • 同人音声の市場は年々増大。DLsiteでは9件/日のペース。
  • DLsiteでは癒し系FANZAでは女性上位系が特に人気。女体化はどっちでも人気。
  • FANZAのユーザーには性癖トガリネズミが比較的多い。

収集対象

FANZA同人、DLsiteで公開されているすべての同人音声を対象に、以下の情報を収集しました。取得日時はばらばらですが、おおむね11/25~27の間です。

  • タイトル
  • 販売価格(定価)
  • 総ダウンロード数
  • 販売期間
  • ジャンル・タグ

データの取得にはPythonのBeautifulsoupを使いました。

ダウンロード数および価格の分布

データを取得した同人音声の総数は、それぞれ以下のようになりました。

DLsite: 16434件

FANZA: 12047件

はえーすっごい数。

同人音声の取り扱い総数はDLsiteの方が4000件ほど多いみたいです。

このデータをいろいろな側面から見ていくことにします。

年度別の同人音声販売数推移

まずは、販売数が年ごとにどのように移り変わっていったのかを見てみます。

f:id:konkon3249:20191127221912p:plain

同人音声の販売数推移

どちらも右肩上がりに増大していますね。DLsiteの販売数は11/27で既に3000件を超えています。おおよそ、FANZAでは6件/日、DLsiteでは9件/日のペースで作品が公開されている計算になります。

自分が同人音声を聞き始めたのは2014~15年あたりなんですが、そのころと比べると販売数は2倍以上です。

すごい量だ。

ダウンロード数の分布

では次に、ダウンロード数の可視化をしてみましょう。同人サークルの方々からすると気になる内容かもしれません。

まずは普通にヒストグラムを作ってみましょう。

f:id:konkon3249:20191127223342p:plain

ダウンロード数のヒストグラム

ダウンロード数が低い(0~200)作品が全体のほとんどを占めることがわかりますね。

ちょっとみにくいので、ダウンロード数の対数を取ってヒストグラムを書き直してみましょう。

f:id:konkon3249:20191127223630p:plain

ダウンロード数のヒストグラム(対数)

はい、どちらもきれいな釣り鐘型のヒストグラムになりました。

つまり、ダウンロード数の分布は対数正規分布で表せることが期待されます。実際この分布は、各人の年収が従う分布であることが知られており、まあ妥当です。

中央値を計算するとDLsiteが240、FANZAが75.0となりました。ダウンロード数の多い順に順位をつけていった場合に、ちょうど中間の順位となる音声のダウンロード数がこの値と一致します。

同人音声のプラットフォームとしての規模は、DLsiteの方が大きいと言えそうです。

販売価格の分布

次は販売価格の分布をみていきましょう。

f:id:konkon3249:20191127224908p:plain

販売価格(定価)の分布

当然と言えば当然ですが、販売価格の分布に大きな違いはありません。が、DLsiteの場合、きわめて低価格(無料~250円)の範囲で度数が大きくなっているのが気になると言えば気になります。

平均価格はDLsiteで885円FANZA1002円となりました。定価で比較すると、FANZAのほうがやや高めです。もちろん、割引やポイント還元等のキャンペーンもあるので、どちらがお得かは一概には言えませんが。

作品ジャンル(タグ)の解析

基本的な統計

FANZAおよびDLsiteいずれの場合も、作品のジャンルを端的に表現するためのタグがつけられています。

まずは、タグの種類をそれぞれ数えてみます。

DLsite: 330件

FANZA: 295件

まあだいたい300件ぐらいですね。

ちなみにタグの使用数ランキングは、以下の通りです。

DLsite

  1. フェラチオ:4247件
  2. 淫語:3351件
  3. 癒し:3232件
  4. ラブラブ/あまあま:2861件
  5. 中出し:2816件

FANZA

  1. フェラ:4891件
  2. 中出し:3280件
  3. オナニー:2646件
  4. 言葉責め:2044件
  5. ラブラブ・あまあま:1896件

FANZAのデータからは、男性向け、成人向け、音声付き、体験版ありなどのタグを解析の対象から外しています。面白くないからね。

同人音声で最も使われているタグは"フェラチオ"のようです。確かに成人向けであればたいてい入っているような……。

ジャンルごとの同人音声の購入数(DL数)比較

ユーザー間での人気ジャンルを推定するためには、同人音声の音声のタグごとにダウンロード数を比較してみればよさそうです。

たとえば、DLsiteの人気タグ上位3つ(フェラチオ, 淫語, 癒し)を有する作品のダウンロード数の分布は以下のようになります。

f:id:konkon3249:20191128165451p:plain

DLsite上位タグ3つを有する作品のダウンロード数分布

赤の点線はダウンロード数の中央値で、それぞれ227,213,345となりました。

さて、この中央値で比較して、最も多くダウンロードされているタグは何でしょうか?

全部のヒストグラムを書くのも大変なので、使われる頻度が高い100個のタグのうちから、ダウンロード数の上位20タグを箱ひげ図で表してみました。

f:id:konkon3249:20191128170713p:plain

DLsiteおよびFANZAの同人音声のジャンルとダウンロード数の関係

こちらの解析では、まず使用される頻度が高い100個のタグを用意してから、そのうちでダウンロード数の中央値が高い順に箱ひげ図を20個並べています。

縦軸がジャンル名、横軸がダウンロード数(対数)を表しています。箱の中のオレンジ色の線の位置が分布の中央値を表していて、その値はタグ名のとなりのカッコ内に表示してあります。 

DLsiteでは耳舐めささやきバイノーラル等のタグがダウンロード数の上位にあります。一方で、FANZAでは逆転無し脚、色仕掛け等のタグが目立ちます。

どうやら、DLsiteのユーザーは癒し系、甘やかし系が、FANZAのユーザーは女性上位系の同人音声が好みのようです。

また、両方を見比べてみると、どちらも性転換・女体化がそれぞれで上位にランクインしていることがわかります。作品数は多くない(どちらのサイトでも170件程度)ですが、ニッチな人気があるジャンルのようです。

同人音声のプラットフォーム別販売数の解析

プラットフォームごとのダウンロード販売数の比

最近の同人音声は、DLsiteとFANZAの両方で販売されることが多いです。

この両方のプラットフォームに同じタイトルで販売されている同人音声の数は、5231件にも上ります。

この同人音声それぞれにおいて、プラットフォームごとのダウンロード販売数の比(DLsite/FANZA)をヒストグラムで表すと以下のようになります。

f:id:konkon3249:20191128224213p:plain

DLsideダウンロード数/FANZAダウンロード数

赤の点線は比率1を表しており、ここから右がDLsiteのダウンロード数が多い領域、左がFANZAでのダウンロード数が多い領域です。

FANZAの方が販売数の多い同人音声の割合は、2.58%となりました。

また、ダウンロード数比の中央値は3.43となりました。

プラットフォームとジャンルごとのダウンロード数の関係

では、ジャンルごとのダウンロード数比の偏りはどうなっているでしょうか。

音声作品のダウンロード数がFANZA > DLsiteとなるジャンルの割合を計算し、上位30位を並べてみたものが以下になります。(タグの表記はFANZAのものに準じています)

f:id:konkon3249:20191128230712p:plain

FANZAの販売数の方が多いジャンルの割合

かっこの中は各ジャンルのタグを付けられた音声の総数、横軸はFANZAの販売数の方が多い音声の割合です。

例えば、FANZAで販売されている浣腸とタグ付けされた音声は、その半分以上がDLsiteのダウンロード数を上回っていることがわかります。

……多すぎない?

しかもなんか尖り気味の性癖が多いですね。スカトロとかおもらしとか……。

基本的にはニッチなジャンルのほうがFANZAでは売れやすいみたいですね。

 

DLsiteのタグとFANZAのタグは一致していないので、相互の比較は手動での関連付け(例: レズ/女同士(DLsite) ↔ 百合(FANZA))が必要です。

気になった10個のタグについて相互に関連付けを行い、ダウンロード数をそれぞれ箱ひげ図で表示した結果が以下のようになります。

f:id:konkon3249:20191128231454p:plain

FANZAおよびDLsiteにおける各ジャンルとダウンロード数の関係

青色がDLsiteの、赤色がFANZAのダウンロード数の分布を表しています。程度は種類により異なりますが、浣腸を除くすべてのジャンルでDLsiteのダウンロード数がFANZAを上回っています。

調査のまとめ

  • 同人音声の販売数は、どちらのプラットフォームでも年々増加しており、2019年現在では、FANZAで約6件/日、DLsiteで約9件/日のペースで作品が公開されている。
  • 同人音声販売プラットフォームのとしての規模は、DLsiteのほうが大きい。ダウンロード数の中央値はDLsite, FANZAでそれぞれ240,74となった。
  • ジャンルごとの同人音声のダウンロード数をプラットフォームごとに比較すると、DLsiteでは癒し系、甘やかし系が、FANZAでは女性上位系のジャンルがよく購入されていることがわかった。また、性転換・女体化のジャンルは、どちらのプラットフォームでも非常に人気がある。
  • 2つのプラットフォームをまたいで販売されている同人音声のみに絞って、ダウンロード数の比とジャンルの関係を調査した。その結果、FANZAではニッチなジャンル(特に浣腸)がDLsiteよりも多く購入されていることがわかった。

最後に

調査の動機と今後の展望

同人音声には日々お世話になっているということもありますが、何よりもDLsite, FANZAのどちらでも作品のダウンロード数が公開されていることが一番の要因でした。

商品の販売数がリアルタイムで公開されていて、しかもタグ付けもしっかりされている大量のデータとか、めちゃくちゃ貴重です。

サークルごと、声優ごとにダウンロード数や価格を見ればランキング的なのも作れそうです。今回はやりませんでしたが。

継続的にダウンロード数のモニタリングしてみると、日別のダウンロード数の増減や、休暇やクリスマス中の傾向とかが見れて面白そうです。

その他にやったこと

タグの共起関係をネットワーク図に書いて遊んだりしました。

f:id:konkon3249:20191128234833p:plain

DLsiteの同人音声作品のタグの共起関係ネットワーク(cos類似度>0.6)

この図からは、たとえば言葉攻めとタグ付けられた音声には、逆レイプ、痴女、逆転無しといったタグが一緒につけられやすいことがわかります。

いずれこれを使って何かやるかもしれません。

DLsiteの購入履歴から性癖の尖度、歪度を判定するやつとか作れそう。どちらも購入リストをオープンにすることはできないので、いわゆるアプリとしての実装は無理そうですが。

 

 最後に、最近買ったなかでお気に入りの作品を貼っておきます。

www.dlsite.com

 

それでは。

 

konkon