SlideShare a Scribd company logo
1 of 46
楽天がHadoopを使う理由


                             Keisuke Kawamura | Development Unit Rakuten, Inc.
                                  Nikkei Computer Seminar 15th Dec. 2010         1




Tuesday, December 21, 2010                                                           1
自己紹介

     河村 圭介(かわむらけいすけ)
      楽天株式会社 Development Unit
      シニアアソフトウェアエンジニア
        - Webサービスの企画・開発
       - 大規模データ解析の処理基盤構築




                                    2




Tuesday, December 21, 2010              2
自己紹介
        課外活動
         楽天で行われる各種技術イベント 企画・運営
         Hadoopソースコードリーディング お手伝い
         事例記事の執筆などなど


        Contact :
         keisuke.kawamura@mail.rakuten.co.jp
         twitter @kkawamura



                                               3




Tuesday, December 21, 2010                         3
Hadoopと私

       ・2009年2月∼
        Hadoopでアプリケーション開発。
        (楽天市場向けレコメンダーシステム)

       ・2010年10月∼
        大規模データの解析インフラの構築が本業に。



                   アプリ開発者→データインフラ担当
                                        4




Tuesday, December 21, 2010                  4
本日お話しすること

                  1. 我々の課題
                  2. 楽天のデータへの取り組み
                  3. Hadoopの利用状況・事例
                  4.Web事業者から見たHadoop
                  5. 今後の展望とまとめ



                                         5




Tuesday, December 21, 2010                   5
我々が直面している課題



                                      6




Tuesday, December 21, 2010                6
楽天市場(らくてんいちば)
                              •日本最大のインターネットショッピングモール
              日本最大            •世界でも独特のビジネスモデル




                店舗数:34,642店
                商品数:6,899万点
                会員数:6,400万人
                流通総額:8,000億円※
                     (※2009年)

                                                       7




Tuesday, December 21, 2010                                 7
グループのビジョン

                                                Business
                                               Business
                                                EC
                                               Application
                                              Application


                                Business
                               Business                        Business
                                                              Business
                             クレジット
                               Application
                              Application                    トラベル
                                                              Application
                                                             Application




                                             会員データベース

                             ポータル/
                               Business
                              Business                         Business
                                                              Business
                             Application
                             Application
                                                               証券
                                                             Application
                                                             Application
                             コンテンツ
                                               Business
                                              Business
                                               金融
                                              Application
                                             Application




                生活に必要なサービス全てを提供する

Tuesday, December 21, 2010                                                  8
楽天グループの国際展開
            インターネット・ショッピングモールビジネス
            トラベル ビジネス
            パフォーマンスマーケティング ビジネス




         ヨーロッパ                                                   アメリカ
                                                   本社



   PriceMinister
                                          アジア   Rakuten Ichiba
                                                                 Buy.com
                                                Taiwan
                             TARAD.com

                                  Indonesia

              インターネット・ショッピングモールビジネス

                             [台湾] 台北                              [米国] カルフォルニア

                             [タイランド] バンコク                         [インドネシア] ジャカルタ

                             [中国] 北京                              [フランス] パリ      9




Tuesday, December 21, 2010                                                           9
インターネットの情報爆発

     2000年 6.2EB                   ZB(ゼッタバイト)
                             45倍
                                    1021
    2007年 281EB                     1,000,000,000,000,000,000,000
                             6倍

    2011年 1.8ZB



                                                              10




Tuesday, December 21, 2010                                         10
現在の楽天市場のサービス規模

       出店店舗   34,642店
       商品数    6,899万商品
       購入者数   919万人 (2010/3Q)
       注文数    32,92万件 (2010/3Q)
       会員数    6400万ID
        




                                        11




Tuesday, December 21, 2010                   11
増え続けるデータ

            会員数    20万ID/月 増加
            月間購入件数 1000万件
            ピークタイム購入件数 1000件 / 分
            PV      1億PV / 日 




                                        12




Tuesday, December 21, 2010                   12
Internet Traffic
                                  20
                                       02
                                            Ja




                                                      0
                                                 n.




Tuesday, December 21, 2010
                                  20
                                       02
                                            Ju
                                  20          l.
                                       03
                                            Ja
                                  20             n.
                                       03
                                            Ju
                                  20          l.
                                       04
                                            Ja
                                  20             n.
                                       04
                                            Ju
                                  20          l
                                       05
                                            Ja
                                  20             n.
                                       05
                                            Ju
                                  20          l.
                                       06
                                            Ja
                                  20             n.
                                       06
                                            Ju
                                                                              Network traffic is growing




                                  20          l.
                                                                             150 times in the last 8 years




                                       07
                                            Ja
                                  20             n.
                                       07
                                            Ju
                                  20          l.
                                       08
                                                                                                             トラフィックの推移




                                            Ja
                                  20             n.
                                       08
                                            Ju
                                  20          l.
                                       09
                                            Ja
                                  20             n.
                                       09
                                            Ju
                                              l.
                             13




13
データの重要性

       データはサービスに様々な価値をもたらす

                   例)Webサービスの場合
                     ・レコメンデーション
                     ・パーソナライゼーション
                     ・情報の提供精度向上
                    

                                       14




Tuesday, December 21, 2010                  14
ウェブサービスの裏側

          より便利なサービスを提供するために、
          バックエンドでは、さまざまなデータ
          分析が必要となる。


          しかし、規模が大きくなれば、データの
          管理も解析も容易ではなくなる。
          ...データは増え続ける。

                                          15




Tuesday, December 21, 2010                     15
各社の技術開発

       •「MapReduce」等は分散並列処理基盤
       •「GFS/BigTable」等は分散データストレージ、KVS

                    「処理」の分散                     「データ」の分散
                                                    GFS/BigTable
                             MapReduce
                                                    Dynamo
                             MapReduceのJava実装
                                                    Windows Azure
                                                    SQL Data Services


                                     fairy                 ROMA




Tuesday, December 21, 2010                                              16
楽天の大規模データへの取り組み

                              Rakuten SuperDB


                              独自プロダクトの開発

                             OSSを利用したデータ解析
                             (Hadoopの利用推進)


                                                17




Tuesday, December 21, 2010                           17
楽天スーパーDB



                                        18




Tuesday, December 21, 2010                   18
楽天スーパーDB
        •楽天には多様なビジネスがあり、様々なデータがある
        •堅牢・強固なDWHに集約し、サービス向上に役立てている

       データの集約                         データの分析・利用


          商品・サービスDB                   リコメンデーショ
                                      パーソナライズ
                                      ン
               顧客属性DB          楽天
                                      購買予測
                             スーパーDB
               購買履歴DB                 指標モニタリング
               閲覧履歴DB




                                                  19




Tuesday, December 21, 2010                             19
スーパーDBのデータ活用
                               サービス特性毎にリコメンドロジックをカスタマイズ可能な、
                TOHO
                                楽天経済圏のレコメンデーションプラットフォーム




         各種レコメンド
         ロジック
                                                レコメンデーション
              協調フィルタリング
               リターゲティング                         プラットフォーム
                     バスケット
                       画像処理

                                        スーパーDB

                             商品・サービスDB 顧客属性DB   購買履歴DB   閲覧履歴DB
                                                                  20




Tuesday, December 21, 2010                                             20
スーパーDBのデータ活用




                       ターゲティング広告などに利用中 
                                            21




Tuesday, December 21, 2010                       21
独自プロダクトの開発



                                          22




Tuesday, December 21, 2010                     22
分散プロダクトの独自開発
             ・Rakuten On-Memory Architecture
               ROMA is one of the data storing systems for
              distributed key-value stores.
               




                                                             23




Tuesday, December 21, 2010                                        23
ROMA: example.

                 Roma was used some services. (ex. Browse
                 History of Rakuten Ichiba and Rakuten Travel. )
                                [Browse History]

                                  Sharing data by
                                    Rakuten ID.




                【PC】                                  【Mobile】

                                                                   24




Tuesday, December 21, 2010                                              24
OSSを利用したデータ解析
                   (Hadoopの利用)


                                 25




Tuesday, December 21, 2010            25
楽天のHadoop環境
                     2008年4月∼
                      検証環境にて検証開始
                     2009年3月∼
                      プロダクション環境で運用開始
                      Hadoop 0.19.2
                      15台構成の小規模クラスタ
                     2010年8月∼
                      3つのクラスタを運用中
                      Hadoop 0.20.2
                      小規模なものが2つ、中規模が1つ
                      
                                           26




Tuesday, December 21, 2010                      26
利用例:商品/購買データ解析




                                              27




Tuesday, December 21, 2010                         27
楽天市場の商品の特徴
               - 楽天はショッピングモール。
               - 同一商品が楽天内に複数存在する。




                                          28




Tuesday, December 21, 2010                     28
楽天の商品データの特徴

           - 商品がユニークではない。商品ID≠製品ID。
           - 商品がコンテンツ。店舗様が独自編集可能。
           - 日々追加・編集される。


                要望:
                サービスのニーズに応じて、商品を解析・
                クラスタリングしたい。
                トライアンドエラーで最適解を探りたい。



                                           29




Tuesday, December 21, 2010                      29
集計処理はHadoop化を推進

                •入力データ
                 商品データ、カタログデータ、購買データ
                 

                •出力データ
                 類似商品クラスタ、製品ごとの商品リスト、
                 ジャンル・価格帯などのクラスタ


            当初はレコメンデーションだけで利用していたが
            利用用途を拡大中。

                                        30




Tuesday, December 21, 2010                   30
利用例:リアルタイムランキング




                                           31




Tuesday, December 21, 2010                      31
デイリーランキング




                                         32




Tuesday, December 21, 2010                    32
ランキング集計処理
          •ジャンルごとに販売数を集計。
          •ジャンルの数:6000。拡大傾向。
          • JavaMapReduceを使わず、Pigで実装している。

           
           •集計処理のコード量削減。
            数行で処理を実装。可読性向上。
           •今後のジャンルの拡大に容易に対応可能に。

            
                                         33




Tuesday, December 21, 2010                    33
現在の主な用途

                             • 購買・アクセスデータ解析
                             • ユーザの行動解析
                             • 商品データ解析
                             • 売れ筋ランキング集計
                             • その他各種データ解析に拡大中
                              
                             • eコマース事業
                             • ネット広告事業 


                                                34




Tuesday, December 21, 2010                           34
Hadoop導入による効果




                                             35




Tuesday, December 21, 2010                        35
以前のデータ解析・集計

              集計用バッチサーバ群で集計・分析
               ・用途ごとにバラバラに実装
               ・1台∼数台で自前の並列分散処理
               ・RDBへの依存
               ・運用が非常に煩雑




                                           36




Tuesday, December 21, 2010                      36
Hadoopがもたらしたもの


                               生産性

                             スケーラビリティ

                              耐障害性

                                          37




Tuesday, December 21, 2010                     37
生産性
      •Map Reduceでプログラムを書くのは容易ではない
          と言われるが、、、


       Map Reduceのフレームワークを理解していれば、
       開発者はビジネスロジックに集中でき、これは大きな
       利点といえる。


      • 開発者に多くの選択肢が提供されている
       - Hadoop StreamingでRubyなどから利用可能
       - 特性に応じてPig / Hiveなどの利用
                                         38




Tuesday, December 21, 2010                    38
スケーラビリティ

                  •増大するデータに対する対応能力
                        - Webでは容易にスケールすることが重要


                  •Webサービスのトラフィック
                        - 必ずしもコントロールできるものではない
                        - 突如数倍になることもある




                                                39




Tuesday, December 21, 2010                           39
耐障害性(運用効率の向上)

                  •Hadoop以前は運用が非常に煩雑
                        - 用途ごとにバラバラに実装
                        - 1台∼数台で自前の並列分散処理
                        - RDBへの依存


                  •Hadoop化により煩雑な運用から開放される




                                             40




Tuesday, December 21, 2010                        40
現在の課題

         環境の統合
               - 小規模∼中規模なクラスタを並行運用中
               - 環境の統合をすすめ、ナレッジの集約や
                効率化を図る


         利用範囲のさらなる拡大
               楽天グループ内のすべてのログデータを解析対象へ
          

                                         41




Tuesday, December 21, 2010                    41
今後の取り組み

           サービス、事業へのフィードバック
                 - ユーザや出店店舗様へのさらなる利便性の提供


                 - レコメンデーション・パーソナライゼーション
                  の強化の基盤としてHadoopを使い倒す


                 - 事業戦略、マーケティングへのデータ活用
            

                                           42




Tuesday, December 21, 2010                      42
まとめ



                                   43




Tuesday, December 21, 2010              43
まとめ
          楽天のデータ戦略
                - 独自プロダクトとOSS利用推進


          利用状況
                - 商品、売上データ、アクセスログなどの解析に利用。
                - 解析結果をサービスへフィードバック。
                - 今後さらに活用範囲をひろげていく。




                                        44




Tuesday, December 21, 2010                   44
まとめ

             Hadoopがもたらすもの
                   - これまで不可能(あきらめていた?)データ
                     解析が可能になる。
                   - バッチが多少早くなるだけではない、
                    不可能を可能する可能性が秘められている。


             アイディア次第
                   - 必ずしも規模が必要なわけではない。
                   - 使いようで小規模でも大きな価値を創出できる。

                                              45




Tuesday, December 21, 2010                         45
ご清聴ありがとうございました




                             46




Tuesday, December 21, 2010        46

More Related Content

What's hot

[Cloud OnAir] BigQuery の仕組みからベストプラクティスまでのご紹介 2018年9月6日 放送
[Cloud OnAir] BigQuery の仕組みからベストプラクティスまでのご紹介 2018年9月6日 放送[Cloud OnAir] BigQuery の仕組みからベストプラクティスまでのご紹介 2018年9月6日 放送
[Cloud OnAir] BigQuery の仕組みからベストプラクティスまでのご紹介 2018年9月6日 放送Google Cloud Platform - Japan
 
PostgreSQL 12は ここがスゴイ! ~性能改善やpluggable storage engineなどの新機能を徹底解説~ (NTTデータ テクノ...
PostgreSQL 12は ここがスゴイ! ~性能改善やpluggable storage engineなどの新機能を徹底解説~ (NTTデータ テクノ...PostgreSQL 12は ここがスゴイ! ~性能改善やpluggable storage engineなどの新機能を徹底解説~ (NTTデータ テクノ...
PostgreSQL 12は ここがスゴイ! ~性能改善やpluggable storage engineなどの新機能を徹底解説~ (NTTデータ テクノ...NTT DATA Technology & Innovation
 
押さえておきたい、PostgreSQL 13 の新機能!!(Open Source Conference 2021 Online/Hokkaido 発表資料)
押さえておきたい、PostgreSQL 13 の新機能!!(Open Source Conference 2021 Online/Hokkaido 発表資料)押さえておきたい、PostgreSQL 13 の新機能!!(Open Source Conference 2021 Online/Hokkaido 発表資料)
押さえておきたい、PostgreSQL 13 の新機能!!(Open Source Conference 2021 Online/Hokkaido 発表資料)NTT DATA Technology & Innovation
 
監査要件を有するシステムに対する PostgreSQL 導入の課題と可能性
監査要件を有するシステムに対する PostgreSQL 導入の課題と可能性監査要件を有するシステムに対する PostgreSQL 導入の課題と可能性
監査要件を有するシステムに対する PostgreSQL 導入の課題と可能性Ohyama Masanori
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionTetsutaro Watanabe
 
Dapr × Kubernetes ではじめるポータブルなマイクロサービス(CloudNative Days Tokyo 2020講演資料)
Dapr × Kubernetes ではじめるポータブルなマイクロサービス(CloudNative Days Tokyo 2020講演資料)Dapr × Kubernetes ではじめるポータブルなマイクロサービス(CloudNative Days Tokyo 2020講演資料)
Dapr × Kubernetes ではじめるポータブルなマイクロサービス(CloudNative Days Tokyo 2020講演資料)NTT DATA Technology & Innovation
 
PostgreSQLによるデータ分析ことはじめ
PostgreSQLによるデータ分析ことはじめPostgreSQLによるデータ分析ことはじめ
PostgreSQLによるデータ分析ことはじめOhyama Masanori
 
Spring Boot の Web アプリケーションを Docker に載せて AWS ECS で動かしている話
Spring Boot の Web アプリケーションを Docker に載せて AWS ECS で動かしている話Spring Boot の Web アプリケーションを Docker に載せて AWS ECS で動かしている話
Spring Boot の Web アプリケーションを Docker に載せて AWS ECS で動かしている話JustSystems Corporation
 
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)Noritaka Sekiyama
 
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~NTT DATA OSS Professional Services
 
その Pod 突然落ちても大丈夫ですか!?(OCHaCafe5 #5 実験!カオスエンジニアリング 発表資料)
その Pod 突然落ちても大丈夫ですか!?(OCHaCafe5 #5 実験!カオスエンジニアリング 発表資料)その Pod 突然落ちても大丈夫ですか!?(OCHaCafe5 #5 実験!カオスエンジニアリング 発表資料)
その Pod 突然落ちても大丈夫ですか!?(OCHaCafe5 #5 実験!カオスエンジニアリング 発表資料)NTT DATA Technology & Innovation
 
DockerコンテナでGitを使う
DockerコンテナでGitを使うDockerコンテナでGitを使う
DockerコンテナでGitを使うKazuhiro Suga
 
Apache Arrow - データ処理ツールの次世代プラットフォーム
Apache Arrow - データ処理ツールの次世代プラットフォームApache Arrow - データ処理ツールの次世代プラットフォーム
Apache Arrow - データ処理ツールの次世代プラットフォームKouhei Sutou
 
Cassandraのしくみ データの読み書き編
Cassandraのしくみ データの読み書き編Cassandraのしくみ データの読み書き編
Cassandraのしくみ データの読み書き編Yuki Morishita
 
Re: ゼロから始める監視設計
Re: ゼロから始める監視設計Re: ゼロから始める監視設計
Re: ゼロから始める監視設計Masahito Zembutsu
 
忙しい人の5分で分かるMesos入門 - Mesos って何だ?
忙しい人の5分で分かるMesos入門 - Mesos って何だ?忙しい人の5分で分かるMesos入門 - Mesos って何だ?
忙しい人の5分で分かるMesos入門 - Mesos って何だ?Masahito Zembutsu
 
ゲームのインフラをAwsで実戦tips全て見せます
ゲームのインフラをAwsで実戦tips全て見せますゲームのインフラをAwsで実戦tips全て見せます
ゲームのインフラをAwsで実戦tips全て見せますinfinite_loop
 

What's hot (20)

[Cloud OnAir] BigQuery の仕組みからベストプラクティスまでのご紹介 2018年9月6日 放送
[Cloud OnAir] BigQuery の仕組みからベストプラクティスまでのご紹介 2018年9月6日 放送[Cloud OnAir] BigQuery の仕組みからベストプラクティスまでのご紹介 2018年9月6日 放送
[Cloud OnAir] BigQuery の仕組みからベストプラクティスまでのご紹介 2018年9月6日 放送
 
PostgreSQL 12は ここがスゴイ! ~性能改善やpluggable storage engineなどの新機能を徹底解説~ (NTTデータ テクノ...
PostgreSQL 12は ここがスゴイ! ~性能改善やpluggable storage engineなどの新機能を徹底解説~ (NTTデータ テクノ...PostgreSQL 12は ここがスゴイ! ~性能改善やpluggable storage engineなどの新機能を徹底解説~ (NTTデータ テクノ...
PostgreSQL 12は ここがスゴイ! ~性能改善やpluggable storage engineなどの新機能を徹底解説~ (NTTデータ テクノ...
 
押さえておきたい、PostgreSQL 13 の新機能!!(Open Source Conference 2021 Online/Hokkaido 発表資料)
押さえておきたい、PostgreSQL 13 の新機能!!(Open Source Conference 2021 Online/Hokkaido 発表資料)押さえておきたい、PostgreSQL 13 の新機能!!(Open Source Conference 2021 Online/Hokkaido 発表資料)
押さえておきたい、PostgreSQL 13 の新機能!!(Open Source Conference 2021 Online/Hokkaido 発表資料)
 
監査要件を有するシステムに対する PostgreSQL 導入の課題と可能性
監査要件を有するシステムに対する PostgreSQL 導入の課題と可能性監査要件を有するシステムに対する PostgreSQL 導入の課題と可能性
監査要件を有するシステムに対する PostgreSQL 導入の課題と可能性
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年version
 
Dapr × Kubernetes ではじめるポータブルなマイクロサービス(CloudNative Days Tokyo 2020講演資料)
Dapr × Kubernetes ではじめるポータブルなマイクロサービス(CloudNative Days Tokyo 2020講演資料)Dapr × Kubernetes ではじめるポータブルなマイクロサービス(CloudNative Days Tokyo 2020講演資料)
Dapr × Kubernetes ではじめるポータブルなマイクロサービス(CloudNative Days Tokyo 2020講演資料)
 
PostgreSQLによるデータ分析ことはじめ
PostgreSQLによるデータ分析ことはじめPostgreSQLによるデータ分析ことはじめ
PostgreSQLによるデータ分析ことはじめ
 
Spring Boot の Web アプリケーションを Docker に載せて AWS ECS で動かしている話
Spring Boot の Web アプリケーションを Docker に載せて AWS ECS で動かしている話Spring Boot の Web アプリケーションを Docker に載せて AWS ECS で動かしている話
Spring Boot の Web アプリケーションを Docker に載せて AWS ECS で動かしている話
 
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
 
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
 
その Pod 突然落ちても大丈夫ですか!?(OCHaCafe5 #5 実験!カオスエンジニアリング 発表資料)
その Pod 突然落ちても大丈夫ですか!?(OCHaCafe5 #5 実験!カオスエンジニアリング 発表資料)その Pod 突然落ちても大丈夫ですか!?(OCHaCafe5 #5 実験!カオスエンジニアリング 発表資料)
その Pod 突然落ちても大丈夫ですか!?(OCHaCafe5 #5 実験!カオスエンジニアリング 発表資料)
 
Hadoop入門
Hadoop入門Hadoop入門
Hadoop入門
 
Azure Data Explorer
Azure Data ExplorerAzure Data Explorer
Azure Data Explorer
 
DockerコンテナでGitを使う
DockerコンテナでGitを使うDockerコンテナでGitを使う
DockerコンテナでGitを使う
 
Vacuum徹底解説
Vacuum徹底解説Vacuum徹底解説
Vacuum徹底解説
 
Apache Arrow - データ処理ツールの次世代プラットフォーム
Apache Arrow - データ処理ツールの次世代プラットフォームApache Arrow - データ処理ツールの次世代プラットフォーム
Apache Arrow - データ処理ツールの次世代プラットフォーム
 
Cassandraのしくみ データの読み書き編
Cassandraのしくみ データの読み書き編Cassandraのしくみ データの読み書き編
Cassandraのしくみ データの読み書き編
 
Re: ゼロから始める監視設計
Re: ゼロから始める監視設計Re: ゼロから始める監視設計
Re: ゼロから始める監視設計
 
忙しい人の5分で分かるMesos入門 - Mesos って何だ?
忙しい人の5分で分かるMesos入門 - Mesos って何だ?忙しい人の5分で分かるMesos入門 - Mesos って何だ?
忙しい人の5分で分かるMesos入門 - Mesos って何だ?
 
ゲームのインフラをAwsで実戦tips全て見せます
ゲームのインフラをAwsで実戦tips全て見せますゲームのインフラをAwsで実戦tips全て見せます
ゲームのインフラをAwsで実戦tips全て見せます
 

Similar to 楽天がHadoopを使う理由

E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐Rakuten Group, Inc.
 
ビジネスリテラシーとしての統計 ビッグデータと統計の活用
ビジネスリテラシーとしての統計 ビッグデータと統計の活用ビジネスリテラシーとしての統計 ビッグデータと統計の活用
ビジネスリテラシーとしての統計 ビッグデータと統計の活用Rakuten Group, Inc.
 
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」基調講演「データのグループウェア化」
基調講演「データのグループウェア化」Cybozucommunity
 
【勉強会資料】採用とソーシャルメディアVer.20110426
【勉強会資料】採用とソーシャルメディアVer.20110426【勉強会資料】採用とソーシャルメディアVer.20110426
【勉強会資料】採用とソーシャルメディアVer.20110426ITmedia_HR(人事・採用)
 
【勉強会資料】採用とソーシャルメディアVer.20110426
【勉強会資料】採用とソーシャルメディアVer.20110426【勉強会資料】採用とソーシャルメディアVer.20110426
【勉強会資料】採用とソーシャルメディアVer.20110426URANO HEIYA
 
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」細谷賢一氏
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」細谷賢一氏【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」細谷賢一氏
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」細谷賢一氏Developers Summit
 
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)ITmedia_HR(人事・採用)
 
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)URANO HEIYA
 
Developers Summit 2012 16-E-1
Developers Summit 2012 16-E-1Developers Summit 2012 16-E-1
Developers Summit 2012 16-E-1Kohei Kumazawa
 
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望 データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望 Koichi Hamada
 
JPC2016: PUP-01 知って得する MPN 最新情報
JPC2016: PUP-01 知って得する MPN 最新情報JPC2016: PUP-01 知って得する MPN 最新情報
JPC2016: PUP-01 知って得する MPN 最新情報MPN Japan
 
デジタル時代の企業変革 - 2020
デジタル時代の企業変革 - 2020デジタル時代の企業変革 - 2020
デジタル時代の企業変革 - 2020Ikuo Misao
 
CMS時代のWeb制作におけるペルソナ戦略
CMS時代のWeb制作におけるペルソナ戦略CMS時代のWeb制作におけるペルソナ戦略
CMS時代のWeb制作におけるペルソナ戦略Katsumi Tazuke
 
受発注for製造業 概要資料.pdf
受発注for製造業 概要資料.pdf受発注for製造業 概要資料.pdf
受発注for製造業 概要資料.pdfssuserfea64a1
 
マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話cyberagent
 
Jisa simposium 120614 selected slides
Jisa simposium 120614 selected slidesJisa simposium 120614 selected slides
Jisa simposium 120614 selected slidesTakayuki Hagihara
 
ユーザに価値を届けるためのデータプラットフォームの考え方
ユーザに価値を届けるためのデータプラットフォームの考え方ユーザに価値を届けるためのデータプラットフォームの考え方
ユーザに価値を届けるためのデータプラットフォームの考え方Daisuke Watanabe
 
ユーザに価値を届けるためのデータプラットフォームの考え方
ユーザに価値を届けるためのデータプラットフォームの考え方ユーザに価値を届けるためのデータプラットフォームの考え方
ユーザに価値を届けるためのデータプラットフォームの考え方Rakuten Group, Inc.
 
「オンラインの情報をオフラインで活用!~ECとリアル店舗のトータルの売上アップを実現するO2O施策とは?~」
「オンラインの情報をオフラインで活用!~ECとリアル店舗のトータルの売上アップを実現するO2O施策とは?~」「オンラインの情報をオフラインで活用!~ECとリアル店舗のトータルの売上アップを実現するO2O施策とは?~」
「オンラインの情報をオフラインで活用!~ECとリアル店舗のトータルの売上アップを実現するO2O施策とは?~」EC_Orange
 
Dyna traceによるuxマネジメント
Dyna traceによるuxマネジメントDyna traceによるuxマネジメント
Dyna traceによるuxマネジメント伸夫 森本
 

Similar to 楽天がHadoopを使う理由 (20)

E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
 
ビジネスリテラシーとしての統計 ビッグデータと統計の活用
ビジネスリテラシーとしての統計 ビッグデータと統計の活用ビジネスリテラシーとしての統計 ビッグデータと統計の活用
ビジネスリテラシーとしての統計 ビッグデータと統計の活用
 
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」基調講演「データのグループウェア化」
基調講演「データのグループウェア化」
 
【勉強会資料】採用とソーシャルメディアVer.20110426
【勉強会資料】採用とソーシャルメディアVer.20110426【勉強会資料】採用とソーシャルメディアVer.20110426
【勉強会資料】採用とソーシャルメディアVer.20110426
 
【勉強会資料】採用とソーシャルメディアVer.20110426
【勉強会資料】採用とソーシャルメディアVer.20110426【勉強会資料】採用とソーシャルメディアVer.20110426
【勉強会資料】採用とソーシャルメディアVer.20110426
 
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」細谷賢一氏
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」細谷賢一氏【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」細谷賢一氏
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」細谷賢一氏
 
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
 
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
【勉強会資料】ソーシャルメディア採用の設計と運用(基礎編)
 
Developers Summit 2012 16-E-1
Developers Summit 2012 16-E-1Developers Summit 2012 16-E-1
Developers Summit 2012 16-E-1
 
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望 データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望
 
JPC2016: PUP-01 知って得する MPN 最新情報
JPC2016: PUP-01 知って得する MPN 最新情報JPC2016: PUP-01 知って得する MPN 最新情報
JPC2016: PUP-01 知って得する MPN 最新情報
 
デジタル時代の企業変革 - 2020
デジタル時代の企業変革 - 2020デジタル時代の企業変革 - 2020
デジタル時代の企業変革 - 2020
 
CMS時代のWeb制作におけるペルソナ戦略
CMS時代のWeb制作におけるペルソナ戦略CMS時代のWeb制作におけるペルソナ戦略
CMS時代のWeb制作におけるペルソナ戦略
 
受発注for製造業 概要資料.pdf
受発注for製造業 概要資料.pdf受発注for製造業 概要資料.pdf
受発注for製造業 概要資料.pdf
 
マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話
 
Jisa simposium 120614 selected slides
Jisa simposium 120614 selected slidesJisa simposium 120614 selected slides
Jisa simposium 120614 selected slides
 
ユーザに価値を届けるためのデータプラットフォームの考え方
ユーザに価値を届けるためのデータプラットフォームの考え方ユーザに価値を届けるためのデータプラットフォームの考え方
ユーザに価値を届けるためのデータプラットフォームの考え方
 
ユーザに価値を届けるためのデータプラットフォームの考え方
ユーザに価値を届けるためのデータプラットフォームの考え方ユーザに価値を届けるためのデータプラットフォームの考え方
ユーザに価値を届けるためのデータプラットフォームの考え方
 
「オンラインの情報をオフラインで活用!~ECとリアル店舗のトータルの売上アップを実現するO2O施策とは?~」
「オンラインの情報をオフラインで活用!~ECとリアル店舗のトータルの売上アップを実現するO2O施策とは?~」「オンラインの情報をオフラインで活用!~ECとリアル店舗のトータルの売上アップを実現するO2O施策とは?~」
「オンラインの情報をオフラインで活用!~ECとリアル店舗のトータルの売上アップを実現するO2O施策とは?~」
 
Dyna traceによるuxマネジメント
Dyna traceによるuxマネジメントDyna traceによるuxマネジメント
Dyna traceによるuxマネジメント
 

More from Rakuten Group, Inc.

コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話Rakuten Group, Inc.
 
楽天における安全な秘匿情報管理への道のり
楽天における安全な秘匿情報管理への道のり楽天における安全な秘匿情報管理への道のり
楽天における安全な秘匿情報管理への道のりRakuten Group, Inc.
 
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...Rakuten Group, Inc.
 
DataSkillCultureを浸透させる楽天の取り組み
DataSkillCultureを浸透させる楽天の取り組みDataSkillCultureを浸透させる楽天の取り組み
DataSkillCultureを浸透させる楽天の取り組みRakuten Group, Inc.
 
大規模なリアルタイム監視の導入と展開
大規模なリアルタイム監視の導入と展開大規模なリアルタイム監視の導入と展開
大規模なリアルタイム監視の導入と展開Rakuten Group, Inc.
 
楽天における大規模データベースの運用
楽天における大規模データベースの運用楽天における大規模データベースの運用
楽天における大規模データベースの運用Rakuten Group, Inc.
 
楽天サービスを支えるネットワークインフラストラクチャー
楽天サービスを支えるネットワークインフラストラクチャー楽天サービスを支えるネットワークインフラストラクチャー
楽天サービスを支えるネットワークインフラストラクチャーRakuten Group, Inc.
 
楽天の規模とクラウドプラットフォーム統括部の役割
楽天の規模とクラウドプラットフォーム統括部の役割楽天の規模とクラウドプラットフォーム統括部の役割
楽天の規模とクラウドプラットフォーム統括部の役割Rakuten Group, Inc.
 
Rakuten Services and Infrastructure Team.pdf
Rakuten Services and Infrastructure Team.pdfRakuten Services and Infrastructure Team.pdf
Rakuten Services and Infrastructure Team.pdfRakuten Group, Inc.
 
The Data Platform Administration Handling the 100 PB.pdf
The Data Platform Administration Handling the 100 PB.pdfThe Data Platform Administration Handling the 100 PB.pdf
The Data Platform Administration Handling the 100 PB.pdfRakuten Group, Inc.
 
Supporting Internal Customers as Technical Account Managers.pdf
Supporting Internal Customers as Technical Account Managers.pdfSupporting Internal Customers as Technical Account Managers.pdf
Supporting Internal Customers as Technical Account Managers.pdfRakuten Group, Inc.
 
Making Cloud Native CI_CD Services.pdf
Making Cloud Native CI_CD Services.pdfMaking Cloud Native CI_CD Services.pdf
Making Cloud Native CI_CD Services.pdfRakuten Group, Inc.
 
How We Defined Our Own Cloud.pdf
How We Defined Our Own Cloud.pdfHow We Defined Our Own Cloud.pdf
How We Defined Our Own Cloud.pdfRakuten Group, Inc.
 
Travel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech infoTravel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech infoRakuten Group, Inc.
 
Travel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech infoTravel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech infoRakuten Group, Inc.
 
Introduction of GORA API Group technology
Introduction of GORA API Group technologyIntroduction of GORA API Group technology
Introduction of GORA API Group technologyRakuten Group, Inc.
 
100PBを越えるデータプラットフォームの実情
100PBを越えるデータプラットフォームの実情100PBを越えるデータプラットフォームの実情
100PBを越えるデータプラットフォームの実情Rakuten Group, Inc.
 
社内エンジニアを支えるテクニカルアカウントマネージャー
社内エンジニアを支えるテクニカルアカウントマネージャー社内エンジニアを支えるテクニカルアカウントマネージャー
社内エンジニアを支えるテクニカルアカウントマネージャーRakuten Group, Inc.
 

More from Rakuten Group, Inc. (20)

コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
 
楽天における安全な秘匿情報管理への道のり
楽天における安全な秘匿情報管理への道のり楽天における安全な秘匿情報管理への道のり
楽天における安全な秘匿情報管理への道のり
 
What Makes Software Green?
What Makes Software Green?What Makes Software Green?
What Makes Software Green?
 
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
 
DataSkillCultureを浸透させる楽天の取り組み
DataSkillCultureを浸透させる楽天の取り組みDataSkillCultureを浸透させる楽天の取り組み
DataSkillCultureを浸透させる楽天の取り組み
 
大規模なリアルタイム監視の導入と展開
大規模なリアルタイム監視の導入と展開大規模なリアルタイム監視の導入と展開
大規模なリアルタイム監視の導入と展開
 
楽天における大規模データベースの運用
楽天における大規模データベースの運用楽天における大規模データベースの運用
楽天における大規模データベースの運用
 
楽天サービスを支えるネットワークインフラストラクチャー
楽天サービスを支えるネットワークインフラストラクチャー楽天サービスを支えるネットワークインフラストラクチャー
楽天サービスを支えるネットワークインフラストラクチャー
 
楽天の規模とクラウドプラットフォーム統括部の役割
楽天の規模とクラウドプラットフォーム統括部の役割楽天の規模とクラウドプラットフォーム統括部の役割
楽天の規模とクラウドプラットフォーム統括部の役割
 
Rakuten Services and Infrastructure Team.pdf
Rakuten Services and Infrastructure Team.pdfRakuten Services and Infrastructure Team.pdf
Rakuten Services and Infrastructure Team.pdf
 
The Data Platform Administration Handling the 100 PB.pdf
The Data Platform Administration Handling the 100 PB.pdfThe Data Platform Administration Handling the 100 PB.pdf
The Data Platform Administration Handling the 100 PB.pdf
 
Supporting Internal Customers as Technical Account Managers.pdf
Supporting Internal Customers as Technical Account Managers.pdfSupporting Internal Customers as Technical Account Managers.pdf
Supporting Internal Customers as Technical Account Managers.pdf
 
Making Cloud Native CI_CD Services.pdf
Making Cloud Native CI_CD Services.pdfMaking Cloud Native CI_CD Services.pdf
Making Cloud Native CI_CD Services.pdf
 
How We Defined Our Own Cloud.pdf
How We Defined Our Own Cloud.pdfHow We Defined Our Own Cloud.pdf
How We Defined Our Own Cloud.pdf
 
Travel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech infoTravel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech info
 
Travel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech infoTravel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech info
 
OWASPTop10_Introduction
OWASPTop10_IntroductionOWASPTop10_Introduction
OWASPTop10_Introduction
 
Introduction of GORA API Group technology
Introduction of GORA API Group technologyIntroduction of GORA API Group technology
Introduction of GORA API Group technology
 
100PBを越えるデータプラットフォームの実情
100PBを越えるデータプラットフォームの実情100PBを越えるデータプラットフォームの実情
100PBを越えるデータプラットフォームの実情
 
社内エンジニアを支えるテクニカルアカウントマネージャー
社内エンジニアを支えるテクニカルアカウントマネージャー社内エンジニアを支えるテクニカルアカウントマネージャー
社内エンジニアを支えるテクニカルアカウントマネージャー
 

Recently uploaded

デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 

Recently uploaded (9)

デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 

楽天がHadoopを使う理由

  • 1. 楽天がHadoopを使う理由 Keisuke Kawamura | Development Unit Rakuten, Inc. Nikkei Computer Seminar 15th Dec. 2010 1 Tuesday, December 21, 2010 1
  • 2. 自己紹介 河村 圭介(かわむらけいすけ)  楽天株式会社 Development Unit  シニアアソフトウェアエンジニア   - Webサービスの企画・開発  - 大規模データ解析の処理基盤構築 2 Tuesday, December 21, 2010 2
  • 3. 自己紹介 課外活動  楽天で行われる各種技術イベント 企画・運営  Hadoopソースコードリーディング お手伝い  事例記事の執筆などなど Contact :  keisuke.kawamura@mail.rakuten.co.jp  twitter @kkawamura 3 Tuesday, December 21, 2010 3
  • 4. Hadoopと私 ・2009年2月∼  Hadoopでアプリケーション開発。 (楽天市場向けレコメンダーシステム) ・2010年10月∼  大規模データの解析インフラの構築が本業に。 アプリ開発者→データインフラ担当 4 Tuesday, December 21, 2010 4
  • 5. 本日お話しすること 1. 我々の課題 2. 楽天のデータへの取り組み 3. Hadoopの利用状況・事例 4.Web事業者から見たHadoop 5. 今後の展望とまとめ 5 Tuesday, December 21, 2010 5
  • 6. 我々が直面している課題 6 Tuesday, December 21, 2010 6
  • 7. 楽天市場(らくてんいちば) •日本最大のインターネットショッピングモール 日本最大 •世界でも独特のビジネスモデル 店舗数:34,642店 商品数:6,899万点 会員数:6,400万人 流通総額:8,000億円※ (※2009年) 7 Tuesday, December 21, 2010 7
  • 8. グループのビジョン Business Business EC Application Application Business Business Business Business クレジット Application Application トラベル Application Application 会員データベース ポータル/ Business Business Business Business Application Application 証券 Application Application コンテンツ Business Business 金融 Application Application 生活に必要なサービス全てを提供する Tuesday, December 21, 2010 8
  • 9. 楽天グループの国際展開 インターネット・ショッピングモールビジネス トラベル ビジネス パフォーマンスマーケティング ビジネス ヨーロッパ アメリカ 本社 PriceMinister アジア Rakuten Ichiba Buy.com Taiwan TARAD.com Indonesia インターネット・ショッピングモールビジネス [台湾] 台北 [米国] カルフォルニア [タイランド] バンコク [インドネシア] ジャカルタ [中国] 北京 [フランス] パリ 9 Tuesday, December 21, 2010 9
  • 10. インターネットの情報爆発 2000年 6.2EB ZB(ゼッタバイト) 45倍 1021 2007年 281EB 1,000,000,000,000,000,000,000 6倍 2011年 1.8ZB 10 Tuesday, December 21, 2010 10
  • 11. 現在の楽天市場のサービス規模 出店店舗   34,642店 商品数    6,899万商品 購入者数   919万人 (2010/3Q) 注文数    32,92万件 (2010/3Q) 会員数    6400万ID   11 Tuesday, December 21, 2010 11
  • 12. 増え続けるデータ 会員数    20万ID/月 増加 月間購入件数 1000万件 ピークタイム購入件数 1000件 / 分 PV      1億PV / 日  12 Tuesday, December 21, 2010 12
  • 13. Internet Traffic 20 02 Ja 0 n. Tuesday, December 21, 2010 20 02 Ju 20 l. 03 Ja 20 n. 03 Ju 20 l. 04 Ja 20 n. 04 Ju 20 l 05 Ja 20 n. 05 Ju 20 l. 06 Ja 20 n. 06 Ju Network traffic is growing 20 l. 150 times in the last 8 years 07 Ja 20 n. 07 Ju 20 l. 08 トラフィックの推移 Ja 20 n. 08 Ju 20 l. 09 Ja 20 n. 09 Ju l. 13 13
  • 14. データの重要性 データはサービスに様々な価値をもたらす 例)Webサービスの場合   ・レコメンデーション   ・パーソナライゼーション   ・情報の提供精度向上   14 Tuesday, December 21, 2010 14
  • 15. ウェブサービスの裏側 より便利なサービスを提供するために、 バックエンドでは、さまざまなデータ 分析が必要となる。 しかし、規模が大きくなれば、データの 管理も解析も容易ではなくなる。 ...データは増え続ける。 15 Tuesday, December 21, 2010 15
  • 16. 各社の技術開発 •「MapReduce」等は分散並列処理基盤 •「GFS/BigTable」等は分散データストレージ、KVS 「処理」の分散 「データ」の分散 GFS/BigTable MapReduce Dynamo MapReduceのJava実装 Windows Azure SQL Data Services fairy ROMA Tuesday, December 21, 2010 16
  • 17. 楽天の大規模データへの取り組み Rakuten SuperDB 独自プロダクトの開発 OSSを利用したデータ解析 (Hadoopの利用推進) 17 Tuesday, December 21, 2010 17
  • 18. 楽天スーパーDB 18 Tuesday, December 21, 2010 18
  • 19. 楽天スーパーDB •楽天には多様なビジネスがあり、様々なデータがある •堅牢・強固なDWHに集約し、サービス向上に役立てている データの集約 データの分析・利用 商品・サービスDB リコメンデーショ パーソナライズ ン 顧客属性DB 楽天 購買予測 スーパーDB 購買履歴DB 指標モニタリング 閲覧履歴DB 19 Tuesday, December 21, 2010 19
  • 20. スーパーDBのデータ活用 サービス特性毎にリコメンドロジックをカスタマイズ可能な、 TOHO 楽天経済圏のレコメンデーションプラットフォーム 各種レコメンド ロジック レコメンデーション 協調フィルタリング リターゲティング プラットフォーム バスケット 画像処理 スーパーDB 商品・サービスDB 顧客属性DB 購買履歴DB 閲覧履歴DB 20 Tuesday, December 21, 2010 20
  • 21. スーパーDBのデータ活用 ターゲティング広告などに利用中  21 Tuesday, December 21, 2010 21
  • 22. 独自プロダクトの開発 22 Tuesday, December 21, 2010 22
  • 23. 分散プロダクトの独自開発 ・Rakuten On-Memory Architecture  ROMA is one of the data storing systems for distributed key-value stores.   23 Tuesday, December 21, 2010 23
  • 24. ROMA: example. Roma was used some services. (ex. Browse History of Rakuten Ichiba and Rakuten Travel. ) [Browse History] Sharing data by Rakuten ID. 【PC】 【Mobile】 24 Tuesday, December 21, 2010 24
  • 25. OSSを利用したデータ解析 (Hadoopの利用) 25 Tuesday, December 21, 2010 25
  • 26. 楽天のHadoop環境 2008年4月∼  検証環境にて検証開始 2009年3月∼ プロダクション環境で運用開始 Hadoop 0.19.2 15台構成の小規模クラスタ 2010年8月∼  3つのクラスタを運用中  Hadoop 0.20.2  小規模なものが2つ、中規模が1つ   26 Tuesday, December 21, 2010 26
  • 27. 利用例:商品/購買データ解析 27 Tuesday, December 21, 2010 27
  • 28. 楽天市場の商品の特徴 - 楽天はショッピングモール。 - 同一商品が楽天内に複数存在する。 28 Tuesday, December 21, 2010 28
  • 29. 楽天の商品データの特徴 - 商品がユニークではない。商品ID≠製品ID。 - 商品がコンテンツ。店舗様が独自編集可能。 - 日々追加・編集される。 要望: サービスのニーズに応じて、商品を解析・ クラスタリングしたい。 トライアンドエラーで最適解を探りたい。 29 Tuesday, December 21, 2010 29
  • 30. 集計処理はHadoop化を推進 •入力データ  商品データ、カタログデータ、購買データ   •出力データ  類似商品クラスタ、製品ごとの商品リスト、  ジャンル・価格帯などのクラスタ 当初はレコメンデーションだけで利用していたが 利用用途を拡大中。 30 Tuesday, December 21, 2010 30
  • 31. 利用例:リアルタイムランキング 31 Tuesday, December 21, 2010 31
  • 32. デイリーランキング 32 Tuesday, December 21, 2010 32
  • 33. ランキング集計処理 •ジャンルごとに販売数を集計。 •ジャンルの数:6000。拡大傾向。 • JavaMapReduceを使わず、Pigで実装している。   •集計処理のコード量削減。 数行で処理を実装。可読性向上。 •今後のジャンルの拡大に容易に対応可能に。   33 Tuesday, December 21, 2010 33
  • 34. 現在の主な用途 • 購買・アクセスデータ解析 • ユーザの行動解析 • 商品データ解析 • 売れ筋ランキング集計 • その他各種データ解析に拡大中   • eコマース事業 • ネット広告事業  34 Tuesday, December 21, 2010 34
  • 35. Hadoop導入による効果 35 Tuesday, December 21, 2010 35
  • 36. 以前のデータ解析・集計 集計用バッチサーバ群で集計・分析  ・用途ごとにバラバラに実装  ・1台∼数台で自前の並列分散処理  ・RDBへの依存  ・運用が非常に煩雑 36 Tuesday, December 21, 2010 36
  • 37. Hadoopがもたらしたもの 生産性 スケーラビリティ 耐障害性 37 Tuesday, December 21, 2010 37
  • 38. 生産性 •Map Reduceでプログラムを書くのは容易ではない と言われるが、、、  Map Reduceのフレームワークを理解していれば、  開発者はビジネスロジックに集中でき、これは大きな  利点といえる。 • 開発者に多くの選択肢が提供されている  - Hadoop StreamingでRubyなどから利用可能 - 特性に応じてPig / Hiveなどの利用   38 Tuesday, December 21, 2010 38
  • 39. スケーラビリティ •増大するデータに対する対応能力 - Webでは容易にスケールすることが重要 •Webサービスのトラフィック - 必ずしもコントロールできるものではない - 突如数倍になることもある 39 Tuesday, December 21, 2010 39
  • 40. 耐障害性(運用効率の向上) •Hadoop以前は運用が非常に煩雑 - 用途ごとにバラバラに実装 - 1台∼数台で自前の並列分散処理 - RDBへの依存 •Hadoop化により煩雑な運用から開放される 40 Tuesday, December 21, 2010 40
  • 41. 現在の課題 環境の統合 - 小規模∼中規模なクラスタを並行運用中 - 環境の統合をすすめ、ナレッジの集約や  効率化を図る 利用範囲のさらなる拡大 楽天グループ内のすべてのログデータを解析対象へ   41 Tuesday, December 21, 2010 41
  • 42. 今後の取り組み サービス、事業へのフィードバック - ユーザや出店店舗様へのさらなる利便性の提供 - レコメンデーション・パーソナライゼーション  の強化の基盤としてHadoopを使い倒す - 事業戦略、マーケティングへのデータ活用   42 Tuesday, December 21, 2010 42
  • 43. まとめ 43 Tuesday, December 21, 2010 43
  • 44. まとめ 楽天のデータ戦略 - 独自プロダクトとOSS利用推進 利用状況 - 商品、売上データ、アクセスログなどの解析に利用。 - 解析結果をサービスへフィードバック。 - 今後さらに活用範囲をひろげていく。 44 Tuesday, December 21, 2010 44
  • 45. まとめ Hadoopがもたらすもの - これまで不可能(あきらめていた?)データ 解析が可能になる。 - バッチが多少早くなるだけではない、  不可能を可能する可能性が秘められている。 アイディア次第 - 必ずしも規模が必要なわけではない。 - 使いようで小規模でも大きな価値を創出できる。 45 Tuesday, December 21, 2010 45
  • 46. ご清聴ありがとうございました 46 Tuesday, December 21, 2010 46