クックパッドのデータを研究者に公開します

こんにちは。検索・編成部の原島です。

大学の研究者にお会いすると、「クックパッドのデータを研究に使用したいんですが...」と相談されることがあります。料理に関する研究をしているけれど、実際のデータがないため、なかなか研究が進まないという相談です。

料理に関する研究が進まないのは、クックパッドにとっても残念なことです。これらの研究は、クックパッドのサービスを改善するための「芽」でもあります。データがないだけで芽が育たないのは、非常に悲しい話です。

このような現状を打破するため、本日から、クックパッドのデータを研究者に公開します。このエントリでは、我々が準備してきたデータ公開の仕様について QA 形式で解説します。

誰が利用できるの?

申請していただいた研究者です。ただし、公的機関(e.g. 大学、独立行政法人)の研究者に限ります。申請時には、クックパッドと国立情報学研究所(後述)による審査があります。

何が利用できるの?

レシピと献立に関するデータです。レシピについては、クックパッドで 2014 年 9 月 30 日までに公開されたレシピが利用可能です。各レシピに付随するデータは以下のとおりです。

  • タイトル
  • 材料
  • 手順
  • つくれぽ(「作りましたフォトレポート」の略)
  • etc

献立については、クックパッドで 2014 年 9 月 30 日までに公開された献立が利用可能です。各献立に付随するデータは以下のとおりです。

  • タイトル
  • 調理時間
  • ポイント
  • コツ
  • etc

レシピ・献立ともに、公開するのは、クックパッド上で誰でも閲覧できるデータ(クロール可能なデータ)だけです。

どうすれば利用できるの?

国立情報学研究所(以下、NII)が運営する情報学データリポジトリで利用申請を受け付けています。NII は、情報学分野の研究を促進させるため、様々なデータを集約しています。そして、それらを利用するための統一的な窓口を設置しています。クックパッドのデータも、NII の協力の下で公開しています。

http://www.nii.ac.jp/dsc/idr/cookpad/cookpad.html

利用手順は下図のとおりです。申請の審査も含めて、申請してから 1 〜 2 週間でデータを利用できます。

f:id:jharashima:20150707112327p:plain

いつから利用できるの?

本日(2 月 24 日)から申請を受け付けます。

なぜ公開するの?

最後に公開の動機です。データを公開する一番の動機は、冒頭でも述べたとおり、料理に関する研究を促進させたいというものです。

料理に関する研究をしている人は沢山います。最近では、料理に関する研究会や国際会議なども開催されています。しかし、データがないことで、多くの研究が行き詰っています。これは非常に残念なことです。

今回のデータ公開は、これらの研究を支援するものです。データがあれば、既存の研究を発展させたり、新しい研究を創出させることができるかもしれません。そして、それらは、まわりまわって、クックパッドのサービスを改善するための芽となります。

また、別の動機として、悪質なクロールを減らしたいというものがあります。

残念ながら、研究者の中には、クックパッドのデータを使用するため、悪質なクロールを行う方がいます。短時間に膨大なリクエストが送られると、最悪の場合、クックパッドのサービスに影響が出る恐れがあります。

しかし、クックパッドがデータを公開すれば、わざわざクロールする必要はありません。公開されているデータを利用する方が、圧倒的に楽です。そして、悪質なクロールが減れば、サービスの健全性も向上します。

まとめ

本日からクックパッドのデータを研究者に公開します。公開するのはレシピや献立に関するデータです。利用申請は NII で受け付けています。本件を通して、沢山の研究が前進すれば幸いです。

データ公開は、私と会員事業部の有賀、同部の村田で運用しています。本件に関するお問い合わせなどありましたら、recipe-corpus [at] cookpad.com までご連絡ください。よろしくお願いします。