検索条件

キーワード
タグ
ツール
開催日
こだわり条件

タグ一覧

JavaScript
PHP
Java
Ruby
Python
Perl
Scala
Haskell
C言語
C言語系
Google言語
デスクトップアプリ
スマートフォンアプリ
プログラミング言語
U/UX
MySQL
RDB
NoSQL
全文検索エンジン
全文検索
Hadoop
Apache Spark
BigQuery
サーバ構成管理
開発サポートツール
テストツール
開発手法
BI
Deep Learning
自然言語処理
BaaS
PaaS
Iaas
Saas
クラウド
AI
Payment
クラウドソフトウェア
仮想化ソフトウェア
OS
サーバ監視
ネットワーク
WEBサーバ
開発ツール
テキストエディタ
CSS
HTML
WEB知識
CMS
WEBマーケティング
グラフィック
グラフィックツール
Drone
AR
マーケット知識
セキュリティ
Shell
IoT
テスト
Block chain
知識

MLSE夏合宿2023(オンライン開催)

  • Chainer
  • Jubatus
  • 機械学習
  • 自然言語処理
  • PayPal
  • データ分析
  • Fintech
  • セキュリティ
2023/06/29(木) 13:00  〜  2023/07/01(土) 12:30

主催:機械学習工学研究会(MLSE)

第6回機械学習工学ワークショップ(MLSE夏合宿2023)

  • 本年もオンライン開催です!
  • いくつかのオンライン会議ツールの使用が必須となっていますので、参加要件をよくお読みください。
  • 早期割引チケットの締切は6月12日(月)です!お早めにお申し込みください。発表者は、必ず6月12日(月)までに参加申し込みしてください。
  • 参加申込締切は 6月19日(月) となります。締切までに申込をお願いします。

ワークショップ開催概要

日程

2023年6月29日(木)13:00~7月1日(土)12:00

参加募集

以下の要領で参加者を募集します。

  1. 会期中を通じて以下のツールが使用可能であること。
  2. 会期中、昼夜通じて合宿に参加できること
    • バーチャルではありますが合宿です。なるべく普段の業務や家庭から離れて合宿のセッションに集中できるようお取り計らいください。

参加費

早期割引 (6/12まで)

  • 一般(JSSST会員): 2,200円
  • 一般(JSSST非会員): 4,400円
  • 学生(会員/非会員問わず): 無料

通常申込み (6/13-6/19)

  • 一般(JSSST会員): 3,300円
  • 一般(JSSST非会員): 5,500円
  • 学生(会員/非会員問わず): 無料

ご注意

  • 参加費は参加申し込み時にPaypalで支払いをお願いします。
  • 参加費は 消費税込み の価格です。
  • 会計処理上の事情により、請求書の発行・領収書の分割等には、対応はできません。

プログラム概要

1日目 (6月29日)

時間 メイン会場(ただしポスターはdiscordです)
13:00-13:20 ウェルカムセッション
13:20-13:30 オープニング
13:30-15:00 基調講演: 岡崎 直観(東京工業大学)
15:00-15:20 スポンサー講演1(Ubie株式会社様)
15:30-17:00 研究発表
17:00-18:00 ポスターセッション1(discord)
18:30-19:30 交流会

2日目 (6月30日)

時間 メイン会場(ポスターはdiscord) 会場1 会場2 会場3
9:00-10:30 [G1]基盤モデルWG [T1]チュートリアル
10:40-12:10 パネルディスカッション
12:10-12:30 スポンサー講演2(サントリーホールディングス株式会社様)
13:30-15:00 [S1]セキュリティ [O1]課題を語り合う
15:10-16:40 [S2]セキュリティ [O2]課題を語り合う [F1]公平性
16:40-17:00 スポンサー講演3(株式会社Citadel AI様)
17:00-18:00 ポスターセッション2(discord)
18:30-18:35 スポンサー紹介(株式会社Preferred Networks様)
18:35-19:30 ナイトセッション

3日目 (7月1日)

時間 メイン会場
9:00-11:15 OST(オープン・スペース・テクノロジー)によるディスカッション([R1]を1テーマとして扱う)
11:30-12:00 クロージング

※ 時間は変更になる可能性があります。

プログラム内容

基調講演

【タイトル】 自然言語生成の仕組みと最先端

【概要】 2022年11月にChatGPTが登場して以来、生成系AIの研究開発が加速している。生成系AI、特に大規模言語モデルは人間を代替する存在になりつつあり、検索、広告、金融、法務、教育、研究など、幅広い分野の広範囲な分野の転換点になり得る。本講演では、大規模言語モデルの基本的な仕組みから最先端の研究を概観し、生成系AIが社会やビジネス、学術にもたらす影響について述べる。

【講演者】
岡崎 直観(東工大) 岡崎 直観(東工大)
2007年東京大学大学院情報理工学系研究科博士課程修了。同大学院特任研究員、東北大学大学院情報科学研究科准教授を経て、2017年より東京工業大学情報理工学院教授。自然言語処理や機械学習の研究に従事。言語処理学会理事。ACL 2023プログラム委員長。

パネルディスカッション

【題目】 LLM・基盤モデルで変わるソフトウェアエンジニアリング

【概要】 2022年11月にChatGPTがリリースされて以降、世界は大きく様変わりしました。人間の言葉でやりとりができる高性能なAIの登場により、高度な知識ベースシステムを極めて簡易に実現できるようになりました。これによって、今までにないソフトウェアが実現できるようになっただけではなく、自然言語のみでほとんどの実装が済んでしまうなど、ソフトウェア開発のあり方も大きく変わろうとしています。 本セッションでは、高機能な基盤モデルとしてのLLMの登場によってソフトウェアエンジニアリングがどのように変わったのか、また、今後どのように変わっていくのかについてパネル形式で議論します。

【登壇者(略歴)】

岡崎 直観(東工大) 岡崎 直観(東工大)
基調講演の欄を参照のこと。

海野 裕也(Preferred Networks) 海野 裕也(Preferred Networks)
2008年東京大学大学院修士課程修了。2008〜2011年日本アイ・ビー・エム株式会社。2011〜2016年株式会社Preferred Infrastructure。2016年より株式会社Preferred Networks、2022年5月よりリテール担当VP。自然言語処理、機械学習、ロボティクスの研究開発、JubatusやChainerなど機械学習用OSSの開発、小売業向けのソリューション開発に従事。

加藤 淳(産総研) 加藤 淳(産総研)
博士(情報理工学)。2014年より国立研究開発法人 産業技術総合研究所研究員、2018年より同主任研究員。同年よりアニメ制作会社アーチ株式会社技術顧問を兼務。 Human-Computer Interaction全般、とくにプログラミング体験(Programming Experience; PX)を向上する研究に従事し、国内勉強会SIGPXの設立、国際会議IEEE VL/HCC、、PX、LIVE (2022・2023 Co-chair)などの運営に携わる。技術移転にも積極的に取り組み、クリエイター・プログラマ向けの創造性支援ツール・サービスを開発、運営。

萩谷 昌己(東大) 萩谷 昌己(東大)
1982年東京大学理学系研究科修士課程修了.京都大学理学博士.京都大学数理解析研究所、東京大学理学部を経て、2001~2022年東京大学情報理工学系研究科教授.2010〜2013年同研究科長.2011〜2017年日本学術会議会員.2021年より東京大学Beyond AI研究推進機構機構長.2022年東京大学名誉教授.プログラミング言語,ソフトウェア検証などに加えて,分子コンピューティングを含む自然計算の研究に従事.

丸山宏(花王) 司会:丸山宏(花王)
1983年東工大修士課程修了。日本IBM東京基礎研究所で26年間、自然言語処理、XML、セキュリティなどの研究に従事。2006-2009同研究所所長。その後キヤノン、統計数理研究所、Preferred Networks(PFN)を経て、現在花王株式会社エグゼクティブ・フェローとPFN取締役を兼任。MLSE発起人の1人。工学博士。

研究発表

論文は予稿集に掲載されています。

[カテゴリ1] 発表30分以内とポスター発表

  • [発表1] 推論結果の不確実性に基づく運用時データシフトの検知, 來間 啓伸, 村田 大二郎, 関根 理敏, 新原 敦介

[カテゴリ2] 発表10分以内とポスター発表

  • [発表2] 前処理に重点を置いたデータ分析環境の提供, 中井 眞人
  • [発表3] 機械学習システムの開発・運用における課題抽出を支援する課題マップの提案, 草場 力, 高重 聡一, 小牧 大輔
  • [発表4] データ分析の実験コードからの Web システム開発高速化, 高重 聡一
  • [発表5] 強化学習における不確実性説明手法の検討, 松下 康平, 間瀬 正啓, 土屋 祐太, 森 靖英
  • [発表6] 決定木のパスの全探索に基づく機械学習モデルの公平性テスト手法の考察, Zhenjiang Zhao, 戸田 貴久, 北村 崇師
  • [発表7] 中小企業での AI 導入とその先の成長戦略, 櫻井 敏明

企画セッション

以下の5つの企画セッションを予定しています。

[S1,S2]機械学習特有の攻撃に対するセキュリティ

機械学習セキュリティに関連して、以下の3つの企画を行う。2スロットを想定し、前半で招待講演を含む講演、後半でハンズオンを行う。

  1. 機械学習セキュリティに関する招待講演を実施する。
    【招待講演】機械学習に特有の脆弱性とセキュリティ・リスク : 菅 和聖 (日本銀行金融研究所)
    【概要】機械学習モデルを搭載したシステムには、通常のシステムにはない特有のセキュリティ・リスクがあります。こうしたリスクを概観するとともに、その性質や発生原因、対策について考察します。また、大規模言語モデルに関心が高まるなか、自然言語処理を行う機械学習モデルに特徴的なリスクについても紹介します。

  2. セキュリティWGで公開している機械学習システムセキュリティガイドラインについて、第2版のβ版を6月に公開予定であり、その紹介をする講演(セキュリティWGメンバーによる講演予定)。既に公開済みの第1版からのアップデート情報を含め、始めて聞く方にもわかりやすいよう、ガイドライン全体を紹介する。

  3. 上記機械学習システムセキュリティガイドライン第2版β版と同時公開予定の機械学習セキュリティ影響分析技術に関して、第1版で公開済みの機械学習セキュリティ脅威分析技術と組み合わせ、セキュリティリスク分析の一連の流れをハンズオンとして体験頂く。体験後は感想や評価を頂き、今後のフィードバックに活かす。

オーガナイザー
  • 矢嶋純(富士通株式会社)
  • 吉岡信和(早稲田大学)
  • 乾真季(富士通株式会社)
  • 笠原史禎(富士通株式会社)
  • 辻健太郎(富士通株式会社)
  • 久連石圭(株式会社東芝)
  • 花谷嘉一(株式会社東芝)
  • 大久保隆夫(情報セキュリティ大学院大学)
  • 林昌純(帝京平成大学)

[R1]LLM・基盤モデルの到来を経て生き残る/新たに必要となる機械学習工学は何か

私達はこれまで「MLSE論文読み会」と称して、これまで主にソフトウェア工学の国際会議で発表されたMLSE関連論文の輪読会を開催してきました。
しかしここにきて、GPT-3に端を発した大規模言語モデル(LLM)やそれらを中心とした基盤モデルによる技術革新が凄まじく、恐らく機械学習を使ったソフトウェアの開発は大きく様変わりすることを余儀なくされるだろうと私達は考えています。
そこで本セッションでは、これまで行ってきた活動の延長でMLSE関連研究のサーベイを改めて行い、その中で、

  • これからも生き残る研究トピック
  • トピックとしては残るがアプローチを刷新しないといけないもの
  • もはや後に残らない研究トピック

といった観点で既存研究の整理をし議論します。その上で、今後の新たな機械学習工学の研究テーマ創出の種まきを本セッションにて行いたいと考えています。

オーガナイザー
  • 今井健男(Ubie株式会社)
  • 原聡(大阪大学)
  • 吉岡信和(早稲田大学)

[O1,O2]機械学習の取組状況や課題を語り合うワークショップ

本セッションでは、各現場での機械学習に関する取組状況や課題について、現状を明らかにし共有するためのワークショップを実施します。

詳細:

  • 背景・課題
    MLOps に関しては実例としてさまざまな取組が発表されている一方で、機械学習を用いる現場はさまざまな事情を抱えており、課題を解決する指針が十分でない現状があります。このため、機械学習オペレーションWGでは、それぞれの現場に適用できる指針を明確にすることを目指しています。

  • セッションの内容
    4名程度のグループに分かれ、それぞれの現場での課題について話し合い、内容を全体で共有します。議論した内容は議事録としてまとめ、2023年時点での現状として共有します。また、この結果をもとに MLOps に関する検討を進めていきます。

参考: 2022 年度の成果

オーガナイザー
  • 杉山阿聖(株式会社Citadel AI)
  • 久井裕貴(株式会社マネーフォワード)
  • 太田満久(Ubie 株式会社)

[F1]AI倫理と公平性

近年、MLを活用したAIシステムの判断に関して、倫理に関するガイドライン(AI倫理)が整理されつつあり、その中でも特に公平性について基礎研究が活発に行われている。しかしながら、AI倫理に関するガイドラインは抽象度が高く、公平性の基礎研究は詳細すぎて、AIシステムがどのような要求を満たすべきとといったシステム開発における要件との関係が明らかになっていない。
AI倫理と公平性WGでは事例(ローン審査AI、チャットボット)に基づいて、 AI倫理と公平性に関して以下の観点で整理してきた。

  • 各ステークホルダが考慮すべきこと
  • ライフサイクルの各工程で考慮すべきこと
  • ステークホルダ間のコミュニケーションのために重要になる共通認識

本企画セッションでは、この結果をもとに、主要なステークホルダが、どのような手順で重要な事項を合意するかを事例で検討し、開発のポイントを整理し、ガイドラインの可能性を探る。

オーガナイザー
  • 吉岡信和(早稲田大学)
  • 江澤美保(クレスコ)
  • 久連石圭(東芝)
  • 八幡晃一郎(日立製作所)

[G1]基盤モデルWG 設立検討

2020年にGPT-3が発表されて以来、様々なタスクに利用可能な基盤モデル・大規模言語モデルが次々と発表され、その活用が既に始まっている。
複数のタスクに応用でき、Fine Tuningすることで特定タスクでより高い性能を発揮できるようになった一方で、大量のデータを必要とすることからデータ収集に対する考慮や、モデルの解釈性の低さへの対応など、今後の機械学習を用いたシステム開発の在り方も大きく変わってくることが予想される。

本企画セッションでは、基盤モデル・大規模言語モデルのシステム開発において、機械学習工学として取り組みが必要なテーマを探るためのディスカッションを行う。

オーガナイザー
  • 江澤美保(クレスコ)
  • 吉岡信和(早稲田大学)

チュートリアル

[T1]生成モデルAPIの品質管理 -- 花王仮想人体生成モデルを例として

ChatGPTでもわかるように、生成モデルは様々な応用がある汎用モデルであり、APIを介してサービスとして提供する形態に向く。本セッションでは、人体に関する生成モデルである花王の仮想人体生成モデルを題材に、それをビジネスとして提供するための品質管理について議論する。90分のセッションの前半を招待講演2本を含む5本の講演にあて、主に訓練データとモデルの品質管理の考え方について述べる。後半は、実際にAPIを通して仮想人体生成モデルを使ってプログラミング(ハンズオン)をしてみることによって、モデルAPIの設計、運用についての考え方や課題についての経験を得る。

講演(およそ60分)
  1. 仮想人体生成モデルの品質管理:尾藤宏達(花王)
    仮想人体生成モデルの全体像と、品質管理における考え方について述べる。

  2. 訓練データの品質管理:日比壮信(花王)
    仮想人体生成モデルに使われたデータのうち、特に横断試験と呼ぶ多項目の訓練データセットの設計と品質管理について述べる。

  3. アルゴリズムとモデルの品質管理:大野健太(PFN)・斉藤友樹(花王)
    仮想人体生成モデルの訓練アルゴリズムと、モデルの品質管理指標について述べる。

  4. 招待講演1: 生成モデルのプライバシー: 南和宏(統計数理研究所)
    生成モデルのプライバシーとして、特に訓練データにおける個人特定のリスク評価について述べる。

  5. 招待講演2: API利用の実際: 斉藤文緒(MILIZE社)
    仮想人体生成モデルを使った健康資産アプリについて、その利用方法と実際に使った経験について紹介する。

ハンズオン(およそ30分): 三好邦彦(花王)

Google Colaboratoryを使い、実際に参加者につかっていただく

講演者

丸山宏(花王)
略歴はパネルディスカッションの欄を参照のこと。

尾藤宏達(花王)
2006年に花王に入社以来、研究開発部門において、生体計測技術開発に従事。2021年より現所属となり、仮想人体生成モデルの開発を担当。 2012年に生体分子イメージング技術の開発で博士(理学)を取得。

日比壮信(花王)
1997年筑波大学大学院医科学研究科修了。同年森永製菓株式会社入社。2004年花王株式会社入社。2013年-2014年Columbia University 客員研究員。現在、花王株式会社 生物科学研究所 生体機能評価室長、博士(農学)

斉藤友樹(花王)
2019年に花王に入社以来、情報システム部門にて画像解析等を活用した課題解決に従事。2023年より現所属となり、仮想人体生成モデルの開発を担当。

大野健太(PFN)
株式会社Preferred Networksエンジニアリングマネージャー。Preferred Infrastructureを経て2014年より現所属、2022年より現職。 2020年深層学習(グラフニューラルネットワークなど)の統計的学習理論に関する研究で博士号取得。Jubutus・Chainerなどの機械学習オープンソフトウェアの開発,ライフサイエンス・ヘルスケア分野の研究開発案件などに従事。

南和宏(統数研)
2006年USダートマス大学コンピュータサイエンス博士課程修了。その後、イリノイ大学、国立情報学研究所等を経て、現在、統計数理研究所 副所長・データ科学研究系 教授。専門分野は情報セキュリティ、特に匿名化、統計開示抑制等のプライバシー保護技術。Ph.D in Computer Science。

斉藤文緒(MILIZE)
株式会社MILIZE 営業本部長。株式会社NTTデータに新卒で入社後、銀行・証券等の金融機関のシステム開発・企画・営業に幅広く従事。2018年4月より現職。MILIZEでは、AI/Fintechの分野の営業企画を担当。

三好邦彦(花王)
精密機器メーカー 研究開発部門、株式会社Preferred Networks、株式会社アーバンエックステクノロジーズ各社において基礎研究の事業化・製品化に従事。2022年2月より現職。

OST(オープン・スペース・テクノロジー)によるディスカッション

OSTは会議の進め方の一つで、参加者自身が検討したいと思っているアイデア、解決したい課題などを持ち寄り、自分達で会議で話すテーマを決めます。(ご参考:https://www.ogis-ri.co.jp/otc/hiroba/Report/EnterpriseAgileGathering2018/ost.html
MLSE夏合宿のOSTでは、以下のような流れで業務で抱えている課題やMLSE夏合宿中で起こったアイデアなどを議論テーマとして挙げていただき、各テーマに分かれて議論します。
1. オープニング
2. 参加者からテーマを募る
3. セッションの時間と場所を決める
4. セッションを行う
5. まとめと共有

表彰

優れたポスター発表に対して「優秀ポスター賞」を授与し、副賞として賞金5000円を進呈します。合宿の参加者全員による投票により決定します。また、優秀ポスター賞受賞者はJSSST大会での発表に招待します。

主催

日本ソフトウェア科学会 機械学習工学研究会

ワークショップ運営組織

実行委員

  • 実行委員長
    • 杉山 阿聖 (Citadel AI / マネーフォワード)
  • 副実行委員長
    • 今井 健男 (Ubie)
  • プログラム委員長
    • 徳本 晋 (富士通)
  • 副プログラム委員長
    • 吉岡 信和 (早稲田大学)
  • ローカル委員長
    • 江澤 美保 (クレスコ)
  • 副ローカル委員長
    • 久連石 圭 (東芝)
  • 会計委員長
    • 竹内 広宜(武蔵大学)

プログラム委員

  • 石川 冬樹 (国立情報学研究所)
  • 今井 健男 (Ubie)
  • 竹内 広宜 (武蔵大学)
  • 原 聡 (大阪大学)
  • 宗像 聡 (富士通)
  • 吉田 則裕 (立命館大学)

スポンサー

ゴールドスポンサー

株式会社Citadel AI

Citadel AI

Ubie株式会社

Ubie

サントリーホールディングス株式会社

サントリーホールディングス株式会社

シルバースポンサー

株式会社 Preferred Networks

Preferred Networks

スポンサー募集

沢山のご応募ありがとうございます。現在、シルバースポンサーのみ募集しています。
詳細はスポンサー募集資料をご覧ください。
ご質問、ご連絡は mlse2023sws@googlegroups.com までお願いします。

Workship