ディープラーニング(深層学習)を用いたビジネスモデル

英DeepMind社の買収が発表されました。これをきっかけにディープラーニングの裾野が広がり、大きなチャンスにつながると期待され、多くのスタートアップの間で機運が高まっています。つまり、Google、Facebook、Yahoo、Microsoftのような社内で技術を確立している大手企業に限らず、スタートアップやすべての企業がディープラーニングの恩恵を受けられる可能性があるということです。
私が考える主な留意点は以下のとおりです。

  1. ディープラーニングは膨大な数のトレーニング用データセットが必要となりますが、大量のデータが頻繁に流出するようなことはあってはなりません。

  2. どのようなアプリケーションにディープラーニングが組み込まれるかといった疑問が浮上しています。すでに汎用性の高いアプリケーションや、いくつかの付随するアプリケーション、または数多くのアプリケーションに使われる可能性もあります。ビジネスモデルに与える影響は計り知れず(プラットフォームの実現性 対 垂直統合)、この影響はしばらく長引くことになるでしょう。

  3. 既定のアプリケーションで、ディープラーニングを円滑に活用するには豊富な経験が欠かせません。この技術を駆使して操作できる人たちは皆、経験があり、多方面の分野から来ています。今後、状況は変わるでしょうが、専門技術がどの程度普及するかは未知数であり、ビジネスオプションにも影響が出るのは確かです。

ここでいくつかのビジネスモデルを、簡単にご紹介しましょう。私はそれぞれのビジネスモデルに当てはまる企業を知っていますが、中には非公開の企業もあるので名前は伏せておくことにします。

  • ハードウェアの販売。シングルコアによる処理の高速化は限界に近づいたので、様々な分野のスタートアップは、アーキテクチャを採用するにあたって、シングルコアに取って代わる技術を探しています(すなわち、非ノイマン型コンピュータ)。ディープラーニングも例外ではありません。

    競争の焦点となっているのはGPUです。長きにわたって優位性を保ってきた主流のアーキテクチャと同様に、GPUもスケールメリットの恩恵を受けています。GPUは、ディープラーニングの共通プラットフォームとして浸透しつつあります。おそらく最後には、ディープラーニング向けに最適化されたチップが、性能的に優位に立つのでしょう。しかし、費用が高額になり、当分の間、普及することはないでしょう。コストの問題を解決するのは実に大変で、Amazon Web ServicesのGPUインスタンスに手軽にアクセスできるという便利なサービスに打ち勝つのは難しいのです。

    もちろん、新しいチップの技術を持つスタートアップは、その技術を社内で使って、この後いくつか紹介するようなビジネスモデルを構築することが可能です。しかし、その程度の技術力のハードウェア企業が編成した社内チームが、ビジネスモデル構築の道をたどることは通常ありません。直観的に考えれば、とにかく、自分たちの作ったチップを売ればいいと思うでしょう(より正確に言えば、チップの知的財産権を売るのですが)。

    すばらしいアーキテクチャの構築に成功しているチームは、おのずと、ディープラーニングを活用している大手企業の買収ターゲットになるでしょう。

  • RedhatやCloudera流の、オープンソースとサービスの融合。ディープラーニングのソフトウェアを無償で提供し、別途、トレーニングとコンサルティングに課金する手法です。ディープラーニングを活用する大手企業の間で広く使用されているTorch7がオープンソースであることから、この手法は一層注目を集めています。もっと手軽にディープラーニングを利用できるようになるには、2つほど課題が考えられます。

    1つ目は、こうしたアプローチを支える、ディープラーニングの多様なアプリケーションやワークロードが十分にあるかどうかです。私が思うに、十分とはいえません。誕生して間もないディープラーニングの魅力は、まだそれほど世間に認知されていません。例えば、random forestsなど、別の手法のほうがもっと有効だとしたらどうでしょう。つまり、なぜ企業は1つの方法に固執するのでしょうか。

    2つ目は、高品質なオープンソースの実装を、開発者任せにしておいてはいけないということです。ディープラーニングを活用するには膨大な調整作業が必要で、良い結果を得るには、科学的要素とともに芸術的要素も重要です。専門技能に関するギャップは、プロによるサービスによって埋められるかもしれません。ただ、そうなれば、ディープラーニングをいかに運用するかが次の課題となります。

  • ホスト型API、サービスとしてのディープラーニング。これはAPIドリブン型の運用です。顧客はデータをアップロードして、ディープラーニングモデルに学習させ、それからクエリを送信します。このモデルには、ユーザビリティやチューニング、スケールアウトの問題の多くを顧客のためにきっぱりと解決できるという利点があります。顧客は、直接もしくは段階的に利用料を請求されます。
    1つの大きな懸念は、ディープラーニングのトレーニング用データセットが非常に大きいという点で、その結果として生じるデータの重さが課題となります。つまり、データフローの形がこの手法を提案しにくくしているのです。

    もう1つ気になるのは、もっと一般的なことですが、このサービスを導入する際の価格を差別化するのが非常に難しいということです。顧客の中には、金融サービス業者もいれば、消費者向けWebサイトの管理者もいます。お金のある方にだけ高額な利用料を請求して、他の人々には高い課金をしないというのは、実現しにくいのです。

  • 個人向けディープラーニングサービス。この場合、スタートアップはデータを集め、ディープラーニングモデル自体をトレーニングして、サービスとしてクエリを提供します。例えば、企業が画像のタグ付けをサービスとして提供するとします。ユーザが画像を提供すると、その画像を表すラベルが与えられます。

    ここで明らかに課題となるのは、ディープラーニングはそもそも、それによってうまく解決すると分かっている問題に適用されているだけだという点で、導入の際によくある障壁がないため、これらの性能は無償になっていくと思われます。これらはすぐに予算内で導入できる基本機能になるでしょう。

言いたいことはたくさんありますが、ここでは、ありのままを投稿するのでなければ決して書かないような例を挙げてみました。

ご意見をtwitterまでお寄せください。