当セミナーは終了いたしました。
多数のお申し込み・ご参加をいただきありがとうございました。

Datapalooza(データパルーザ)は、データ・サイエンティストとデータ・エンジニアが一堂に会して学ぶためのコミュニティ・イベントです。

世界各地で開催しているイベントを、6月15日、16日に東京で開催することになりました。

IoT やディープ・ラーニングが現実に世界を変え始めた今、分析手法や開発環境について具体的に学び、データ・サイエンティスト/データ・エンジニアとしてのスキルを深めていくことが求められています。本イベントでは、初級編から上級編まで、既にデータ・サイエンティストとして活躍されている講師による様々な内容のセッションを提供いたします。
RやPython、Sparkや機械学習について具体的に学びたい、データ・サイエンスで何がどこまで出来るかを知りたいという方にご参加いただき、同じ関心を持つ人たちの交流の場となれば幸いです。

*本イベントでは、いくつかのセッションでフリーウェアの「Data Scientist Workbench」を使用します。

参加ご希望の方は、事前に下記サイトでData Scientist Workbenchに登録されておくことをお勧めします。

開催概要

開催日時:

2016年6月15日(水曜日)、16日(木曜日)10時30分~18時(10時受付開始)


場所:

東京都千代田区外神田3-12-8


参加費:

事前登録制、無料


対象:

データ・サイエンティスト、データ・エンジニア


お申し込み:

終了しました

プログラム

Day1

10時30分~11時30分 G-1 General Session 満席
株式会社リクルートライフスタイル 原田博植
  <Data Engineer> <Data Scientist>
13時~14時 1-1 満席 2-1 満席
14時15分~15時15分 1-2 2-2 満席
Takashi J. OZAKI, Ph.D. @TJO_datasci
15時30分~16時30分 1-3 満席 2-3
IBM Canada
Analytics Platform, Data Scientist,
Polong Lin
16時45分~17時45分 1-4 2-4
IBM Canada
Analytics Platform, Data Scientist,
Polong Lin

Day2

  <Data Engineer> <Data Scientist>
10時30分~11時30分 3-1 満席 4-1 満席
13時~14時 3-2 満席 4-2 満席
レイ・フロンティア株式会社
14時15分~15時15分 3-3 満席 4-3 満席
15時30分~16時30分 3-4 満席 4-4
日本アイ・ビー・エム株式会社
ITスペシャリスト
宋 珠憲
  Data Scientist Workbenchとロードマップ・新機能の発表と、株式会社Sansan様主催のデータ分析コンペの説明
  日本アイ・ビー・エム株式会社
Analytics事業部テクニカル・リード
土屋 敦
16時45分~17時45分 G-2 General Session 満席
株式会社イデアラボ 澤井 大樹
株式会社オプトホールディング 中林 紀彦(モデレーター)
株式会社つみき 鈴木 貴幸
DATUM STUDIO株式会社/Py Ladies Tokyo 真嘉比 愛
株式会社リクルートライフスタイル 原田 博植
日本アイ・ビー・エム株式会社 土屋 敦(司会)

プログラム

Day1

10時30分~11時30分


G-1 General Session 満席

 

シンクタンク、外資ITベンチャー、リクルートでデータサイエンスの事業への実装を牽引してきた経験から、データ活用の組織装着の実務事例を講演します。また、発射台としてのデータサイエンス環境を構築した後に推進した、分析施策のさまざまな事例を共有します。

株式会社リクルートライフスタイル 原田博植


13時~14時


<Data Engineer>
1-1 満席

1-1 セッション概要

HadoopやSparkがどのような仕組みのソフトウェアで、何を実現していて、何がスゴいのか、基本に立ち返ってご説明します。単語は知っているもの理解に自信がないなと感じている方にとって有益な時間となるはずです。

HadoopやSparkがどのような仕組みのソフトウェアで、何を実現していて、何がスゴいのか、基本に立ち返ってご説明します。単語は知っているもの理解に自信がないなと感じている方にとって有益な時間となるはずです。

1-1 講師バイオ

日本Hadoopユーザー会のメンバとして、イベント「Hadoop / Spark Conference Japan」や勉強会「Hadoopソースコードリーディング」を主導している。普段はNTTデータ技術革新統括本部に所属し、HadoopやSparkに関する技術支援やサポートサービスを担当している。


<Data Scientist>
2-1 満席

2-1 セッション概要

成功とは、データ分析を活用した新しい業務が定着化した状態を指します。この状態に到達するために、何をすべきでしょうか。もちろん適切なアナリティクス技術の活用は重要ですが、それだけではありません。多数の実践を基にまとめた著書『データサイエンティスト・ハンドブック』の内容を中心に、成功するデータ分析の進め方について解説します。

成功とは、データ分析を活用した新しい業務が定着化した状態を指します。この状態に到達するために、何をすべきでしょうか。もちろん適切なアナリティクス技術の活用は重要ですが、それだけではありません。多数の実践を基にまとめた著書『データサイエンティスト・ハンドブック』の内容を中心に、成功するデータ分析の進め方について解説します。

2-1 講師バイオ

1995年早稲田大学理工学研究科機械工学専攻博士課程修了。1995年日本アイ・ビー・エム株式会社東京基礎研究所入所。2007年日本アイ・ビー・エム株式会社コンサルティング部門に異動。2009年コンサルティング部門で先進的アナリティクスチームのリーダーを務める。併せて多数のデータ分析プロジェクトを実施し、現在に至る。データサイエンティスト・ハンドブックの共著者。

1995年早稲田大学理工学研究科機械工学専攻博士課程修了。1995年日本アイ・ビー・エム株式会社東京基礎研究所入所。2007年日本アイ・ビー・エム株式会社コンサルティング部門に異動。2009年コンサルティング部門で先進的アナリティクスチームのリーダーを務める。併せて多数のデータ分析プロジェクトを実施し、現在に至る。データサイエンティスト・ハンドブックの共著者。


14時15分~15時15分


<Data Engineer>
1-2

1-2 セッション概要

1-2 講師バイオ

IBMのソフトウェア開発技術者で、オープンソースソフトウェアに活発に携わっており、「初めてのSpark」他、初期のSparkの書籍も執筆している。IBM以前には、Alpine、Databricks、Google、Foursquare、Amazonで検索と分類についての仕事に携わってきた。ウォータールー大学でコンピュータサイエンスと数学の学士を取得。ソフトウェアの他には、炎と金属溶接のアート、そしてフラフープを楽しんでいる。

IBMのソフトウェア開発技術者で、オープンソースソフトウェアに活発に携わっており、「初めてのSpark」他、初期のSparkの書籍も執筆している。IBM以前には、Alpine、Databricks、Google、Foursquare、Amazonで検索と分類についての仕事に携わってきた。ウォータールー大学でコンピュータサイエンスと数学の学士を取得。ソフトウェアの他には、炎と金属溶接のアート、そしてフラフープを楽しんでいる。


<Data Scientist>
2-2 満席

2-2 セッション概要

機械学習に基づくにせよ、統計学に拠るにせよ、ビジネス実務の現場においてデータをモデリングするに当たっては陰に陽に様々な前提を伴います。とある現場では意思決定のためにモデルを活用する一方で、別のとある現場ではあくまでもシステム上で自動的に最適なアウトプットを出力させるためにモデルを活用する、というように一口に「モデリング」と言ってもその利用法は様々です。この講演では、モデルの「説明性(Interpretability)」と「予測性(predictivity)」という側面に着目し、どのようなモデリング手法がいかなるビジネス上の課題に適しているか、そしてそれらのモデルを利用する上でどういうことに気をつけなければいけ ないのか、について概説します。

Takashi J. OZAKI, Ph.D. @TJO_datasci


15時30分~16時30分


<Data Engineer>
1-3 満席

1-3 セッション概要

本発表では,Spark MLlib やそれに関連する機能を解説するとともに、世界中の企業でどのような活用が行われているかを紹介します。

本発表では,Spark MLlib やそれに関連する機能を解説するとともに、世界中の企業でどのような活用が行われているかを紹介します。

1-3 講師バイオ

リクルートテクノロジーズのアドバンスドテクノロジーラボで Spark の MLlib 関連の開発に関わる。そのほかオライリー・ジャパン「Sparkによる実践データ解析」の監訳や技術評論社「詳解Apache Spark」の執筆などに携わる。

リクルートテクノロジーズのアドバンスドテクノロジーラボで Spark の MLlib 関連の開発に関わる。そのほかオライリー・ジャパン「Sparkによる実践データ解析」の監訳や技術評論社「詳解Apache Spark」の執筆などに携わる。


<Data Scientist>
2-3

2-3 セッション概要

R, Pythoh, そしてScalaを対話形式のシェルで記述/実行するためのツールIBM Data Scientist Workbench。ブラウザーがあればすぐに高度なデータサイエンスが実行できます。
*実習形式のため、PCをご持参ください。

R, Pythoh, そしてScalaを対話形式のシェルで記述/実行するためのツールIBM Data Scientist Workbench。ブラウザーがあればすぐに高度なデータサイエンスが実行できます。
*実習形式のため、PCをご持参ください。

IBM Canada
Analytics Platform, Data Scientist,
Polong Lin


16時45分~17時45分


<Data Engineer>
1-4

1-4 セッション概要

Apache Sparkの機械学習の機能を活用し、Bluemixで取得したIoTデータの分析を行います。Apache Sparkの入門的なセッションです。

Apache Sparkの機械学習の機能を活用し、Bluemixで取得したIoTデータの分析を行います。Apache Sparkの入門的なセッションです。

1-4 講師バイオ

Apache Spark, Apache Mesos, Neo4j
分散システムの設計構築、データ分析

Apache Spark, Apache Mesos, Neo4j
分散システムの設計構築、データ分析


<Data Scientist>
2-4

2-4 セッション概要

R, Pythoh, そしてScalaを対話形式のシェルで記述/実行するためのツールIBM Data Scientist Workbench。ブラウザーがあればすぐに高度なデータサイエンスが実行できます。
*実習形式のため、PCをご持参ください。

R, Pythoh, そしてScalaを対話形式のシェルで記述/実行するためのツールIBM Data Scientist Workbench。ブラウザーがあればすぐに高度なデータサイエンスが実行できます。
*実習形式のため、PCをご持参ください。

IBM Canada
Analytics Platform, Data Scientist,
Polong Lin


Day2

10時30分~11時30分


<Data Engineer>
3-1 満席

3-1 セッション概要

エンジニアがデータサイエンスを始めるにあたって、必要となるスキル、取り組みの手順、心構えなどついて、経験を交えて解説します

エンジニアがデータサイエンスを始めるにあたって、必要となるスキル、取り組みの手順、心構えなどついて、経験を交えて解説します

3-1 講師バイオ

金融系・組み込み系・コミュニティサービス・ゲーム・広告系・オンライン・ショップ系と、多様なビジネスでの重要な機能を担うエンジニアとして豊富な経験を持つ。サーバーサイド、フロントエンド、ミドルウェア、インフラと幅広く担当できるフルスタックエンジニア。Aerospikeのコントリビュータでもある。

金融系・組み込み系・コミュニティサービス・ゲーム・広告系・オンライン・ショップ系と、多様なビジネスでの重要な機能を担うエンジニアとして豊富な経験を持つ。サーバーサイド、フロントエンド、ミドルウェア、インフラと幅広く担当できるフルスタックエンジニア。Aerospikeのコントリビュータでもある。


<Data Scientist>
4-1 満席

4-1 セッション概要

みなさんは心理学にどのようなイメージをお持ちでしょうか?心理学には多くの分野がありますが、そのほとんどは観察・調査・実験によって測定されたデータを統計的に分析する仮説検証型のサイエンスです。このセッションでは、心理学におけるデータの扱い方、定性データと定量データ、心理学とビッグデータ、などのトピックについて事例を交えて概説いたします。

みなさんは心理学にどのようなイメージをお持ちでしょうか?心理学には多くの分野がありますが、そのほとんどは観察・調査・実験によって測定されたデータを統計的に分析する仮説検証型のサイエンスです。このセッションでは、心理学におけるデータの扱い方、定性データと定量データ、心理学とビッグデータ、などのトピックについて事例を交えて概説いたします。

4-1 講師バイオ

2010年、株式会社イデアラボを設立。心理学的手法を用いたアプローチで、質問紙尺度、テキスト、反応時間、生体情報などのデータを計測・分析し、企業の問題解決を支援する。筑波大学大学院人間総合科学研究科心理学専攻在学中。

2010年、株式会社イデアラボを設立。心理学的手法を用いたアプローチで、質問紙尺度、テキスト、反応時間、生体情報などのデータを計測・分析し、企業の問題解決を支援する。筑波大学大学院人間総合科学研究科心理学専攻在学中。


13時~14時


<Data Engineer>
3-2 満席

3-2 セッション概要

IoTで特に注目される位置情報活用でのSparkを利用した先進ソリュー ションについて、実例をベースにわかりやすくご紹介します。人間の活動とそれに伴う周囲の変化が生み出す大量のデータ。これらから今の状況を瞬時に把握し、分析し、最適な意思決定と行動を取ることがイノベーションを加速します。レイ・フロンティア社のSilentLog Analyticsは、記録されたユーザーの移動手段、経路、歩数といった行動情報を人工知能を使ってリアルタイムに記録・分析します。

IoTで特に注目される位置情報活用でのSparkを利用した先進ソリュー ションについて、実例をベースにわかりやすくご紹介します。人間の活動とそれに伴う周囲の変化が生み出す大量のデータ。これらから今の状況を瞬時に把握し、分析し、最適な意思決定と行動を取ることがイノベーションを加速します。レイ・フロンティア社のSilentLog Analyticsは、記録されたユーザーの移動手段、経路、歩数といった行動情報を人工知能を使ってリアルタイムに記録・分析します。

レイ・フロンティア株式会社


<Data Scientist>
4-2 満席

4-2 セッション概要

IoT時代になり、今までよりはるかに大量のデータが作られるようになりました。IoTデータはどうやって作られるのか、どのように扱っていけばよいのかなどを,わかりやすく、デモを交えながら解説します。

IoT時代になり、今までよりはるかに大量のデータが作られるようになりました。IoTデータはどうやって作られるのか、どのように扱っていけばよいのかなどを,わかりやすく、デモを交えながら解説します。

4-2 講師バイオ

普段はソフトウェアエンジニアです。色々なプロジェクトを渡り歩いてたらインフラ、ミドルウェア、アプリまで大体自力でなんとかできるようになりました。

普段はソフトウェアエンジニアです。色々なプロジェクトを渡り歩いてたらインフラ、ミドルウェア、アプリまで大体自力でなんとかできるようになりました。


14時15分~15時15分


<Data Engineer>
3-3 満席

3-3 セッション概要

現在、DMM.comでは、1日あたり1億レコード以上の行動ログを中心に、各サービスのコンテンツ情報や、地域情報のようなオープンデータを収集し、データドリブンマーケティングやマーケティングオートメーションに活用しています。本発表では、DMM.comのビッグデータ基盤について紹介し、ビッグデータを処理するためのSQLの活用について発表します。特に、代表的なSQL on HadoopのプロダクトであるHiveやSparkSQL, Prestoの活用事例や、Sqoopを用いたRDBとの連携について、具体的な事例や導入時の注意点を解説し、現状の課題と今後の方針についても紹介します。

現在、DMM.comでは、1日あたり1億レコード以上の行動ログを中心に、各サービスのコンテンツ情報や、地域情報のようなオープンデータを収集し、データドリブンマーケティングやマーケティングオートメーションに活用しています。本発表では、DMM.comのビッグデータ基盤について紹介し、ビッグデータを処理するためのSQLの活用について発表します。特に、代表的なSQL on HadoopのプロダクトであるHiveやSparkSQL, Prestoの活用事例や、Sqoopを用いたRDBとの連携について、具体的な事例や導入時の注意点を解説し、現状の課題と今後の方針についても紹介します。

3-3 講師バイオ

<加嵜 長門>
2014年にDMM.comラボへ入社し、ビッグデータ分析基盤の構築プロジェクトの立ち上げに携わる。現在では、Apache Sparkによるレコメンドエンジンの開発や、SQL on Hadoopを用いたデータ処理基盤の構築を担当。

<鈴木 翔太>
2015年にDMM.comラボへ新卒として入社し、ビッグデータ部への配属後、ユーザーの行動分析のためのBIアプリケーションを開発。現在では、PrestoをはじめとするMPPクエリエンジンを活用した、セグメンテーションエンジンの設計/開発を担当。

<加嵜 長門>
2014年にDMM.comラボへ入社し、ビッグデータ分析基盤の構築プロジェクトの立ち上げに携わる。現在では、Apache Sparkによるレコメンドエンジンの開発や、SQL on Hadoopを用いたデータ処理基盤の構築を担当。

<鈴木 翔太>
2015年にDMM.comラボへ新卒として入社し、ビッグデータ部への配属後、ユーザーの行動分析のためのBIアプリケーションを開発。現在では、PrestoをはじめとするMPPクエリエンジンを活用した、セグメンテーションエンジンの設計/開発を担当。


<Data Scientist>
4-3 満席

4-3 セッション概要

プログラミング言語Pythonはデータ分析に特化したライブラリを豊富に備えており,Pythonを使ったデータ分析技術は注目度の高い分野の一つとして台頭しています.このセッションでは,Pythonを利用してデータ分析を始めたいという方を対象に,Pythonを使ったデータ分析環境(Jupyter Notebook)の構築方法から,統計分析(pandas)/ 機械学習(scikit-learn)/ グラフ描画(matplotlib)まで,データ分析に必要かつ便利なモジュールを紹介します。

プログラミング言語Pythonはデータ分析に特化したライブラリを豊富に備えており,Pythonを使ったデータ分析技術は注目度の高い分野の一つとして台頭しています.このセッションでは,Pythonを利用してデータ分析を始めたいという方を対象に,Pythonを使ったデータ分析環境(Jupyter Notebook)の構築方法から,統計分析(pandas)/ 機械学習(scikit-learn)/ グラフ描画(matplotlib)まで,データ分析に必要かつ便利なモジュールを紹介します。

4-3 講師バイオ

DATUM STUDIO株式会社にてデータ分析業務に従事.2014年にPyLadies Tokyoを立ち上げ,代表を務める.著書に「Python ライブラリ厳選レシピ」がある(所属:DATUM STUDIO,PyLadies Tokyo)

DATUM STUDIO株式会社にてデータ分析業務に従事.2014年にPyLadies Tokyoを立ち上げ,代表を務める.著書に「Python ライブラリ厳選レシピ」がある(所属:DATUM STUDIO,PyLadies Tokyo)


15時30分~16時30分


<Data Engineer>
3-4 満席

3-4 セッション概要

ベンチャーやスタートアップ企業において提供するサービスやプロダクトの価値に加えて、データやデータサイエンスを活用して競争力を発揮するために必要なことを戦略、技術、人材などの観点から解説します。

ベンチャーやスタートアップ企業において提供するサービスやプロダクトの価値に加えて、データやデータサイエンスを活用して競争力を発揮するために必要なことを戦略、技術、人材などの観点から解説します。

3-4 講師バイオ

2015年、株式会社オプトホールディング入社。データサイエンスラボの副所長として、新たな経営資源である”データ”を最大限に活用できる環境を創り企業やスタートアップがグローバルで競争力のある企業へ成長するための支援を行う。また2014年4月より、筑波大学大学院の客員准教授としてビッグデータ分析に関して企業の即戦力となる人材育成を担う。

2015年、株式会社オプトホールディング入社。データサイエンスラボの副所長として、新たな経営資源である”データ”を最大限に活用できる環境を創り企業やスタートアップがグローバルで競争力のある企業へ成長するための支援を行う。また2014年4月より、筑波大学大学院の客員准教授としてビッグデータ分析に関して企業の即戦力となる人材育成を担う。


<Data Scientist>
4-3 満席

4-4 セッション概要

IBM Bluemixは、様々なビックデーター系のサービスがクラウドベースで提供されています。その中には「Apache Spark、Hadoop、アナリティクス、ストレージ」など、データサイエンスに必要とされているテクノロジーが集約されています。 今回のセッションでは、IBM Bluemixで実現可能なデータサイエンスの世界をみなさまにご紹介いたします。

IBM Bluemixは、様々なビックデーター系のサービスがクラウドベースで提供されています。その中には「Apache Spark、Hadoop、アナリティクス、ストレージ」など、データサイエンスに必要とされているテクノロジーが集約されています。 今回のセッションでは、IBM Bluemixで実現可能なデータサイエンスの世界をみなさまにご紹介いたします。

日本アイ・ビー・エム株式会社 ITスペシャリスト 宋 珠憲

Data Scientist Workbenchとロードマップ・新機能の発表と、株式会社Sansan様主催のデータ分析コンペの説明

日本アイ・ビー・エム株式会社  Analytics事業部テクニカル・リード  土屋 敦


16時45分~17時45分


G-2 General Session 満席

G-2 セッション概要

データ・サイエンスの未来を語る:(仮)
データ・サイエンス実践企業による、データ活用の課題と取り組み

データ・サイエンスの未来を語る:(仮)
データ・サイエンス実践企業による、データ活用の課題と取り組み

株式会社イデアラボ 澤井 大樹
株式会社オプトホールディング 中林 紀彦(モデレーター)
株式会社つみき 鈴木 貴幸
DATUM STUDIO株式会社/Py Ladies Tokyo 真嘉比 愛
株式会社リクルートライフスタイル 原田 博植
日本アイ・ビー・エム株式会社 土屋 敦(司会)

フィーチャード スポンサー

株式会社イデアラボ

OPT Data Science Lab

DATUM STUDIO 株式会社

PyLadies

株式会社 DMM.comラボ

リクルートテクノロジーズ

リクルートライフスタイル

クリエーションライン株式会社

レイ・フロンティア株式会社

日本Hadoopユーザー会

メディアスポンサー