「LLMの安全性シンポジウム2025」

2025.06.25 イベント

LLMの安全性シンポジウム 2025

本センターが主宰するLLM-jpの安全性WGではLLMの安全性実現に向けた様々な活動を行っています。本シンポジウムは、LLMの安全性に関心を持つ多様な関係者が集い、知見を共有するための初の場として開催します。

開催日時

2025年7月23日（水）10:00-17:00

会場

東京都千代田区一橋大学一橋講堂中会議場3・4（ハイブリッド開催）
アクセス

開催趣旨

大規模言語モデル(LLM)の開発が日本中で行われていますが、その応用においては安全性への配慮が重要です。国立情報学研究所（NII）の大規模言語モデル研究開発センター（LLMC）が主宰するLLM-jpの安全性WGでは、LLMの安全性実現のための様々な活動を実施しており、AnswerCarefullyなどのデータセットの公開や、AI Safety Instituteとの協力を通じて、アカデミアの立場から日本のLLMの安全性研究を牽引しています。一方、多くの企業でもLLMの安全性の実現への努力がなされ、大学や研究機関でも個別に安全性に関する研究開発が行われています。今後、日進月歩のLLMの安全性を実現していくためには、この問題に関心のある人たちが集結して知見を共有し、社会全体でこの問題に取り組む必要があります。しかし現状、そういった情報共有の場は少なく、まずはこのシンポジウムをキックオフの場として開催し、将来的には多くの方の力を合わせられる方向性を模索していきます。

プログラム・登壇者

【午前の部】AI安全性に関するプロジェクトと企業の動向（１）　座長：関根聡
10:00	LLM-jp安全性WGの紹介	関根聡	NII-LLMC
10:15	Agentic AIの脆弱性と緩和策について（仮）	築地テレサ	SherLOCK株式会社
10:30	AIセーフティ・AIマネジメントを取り巻く国際標準と世界情勢（仮）	三宅和公	住友電気工業株式会社
10:45	AIセーフティリスクの中期的見立て（仮）	小西弘一	国立研究開発法人産業技術総合研究所
11:00	生成AI時代の新たなリスクに対応する“AIトラストとセキュリティ”技術	兒島尚	富士通株式会社
11:15	フェイクニュースの社会課題を解決する偽情報対策技術	山本大	富士通株式会社
11:30	ステレオタイプのレッドチーミングの枠組みをめぐる課題（仮）	江間有沙	東京大学
11:45	ライトニングトーク
12:00	昼食休憩
【午後1】AI安全性に関するプロジェクトと企業の動向（２）　座長：松田寛
13:00	世界のAI安全性の動きとAIセーフティーインスティテュートについて	村上明子	AIセーフティ・インスティテュート
13:15	SB Intuitionsの安全性チーム	綿岡晃輝	SB Intuitions株式会社
13:30	Preferred NetworksにおけるAIガバナンスの取り組み（仮）	大野健太	株式会社Preferred Networks
13:45	LLMアプリケーションの安全性検証（仮）	劉弘毅	株式会社Citadel AI
14:00	LLMのステレオタイプ的応答とその類型化の必要性	松田寛	株式会社リクルート Megagon Labs
14:15	パネルディスカッション　松田寛（司会）
14:50	休憩
【午後2】AI安全性評価と安全性向上技術　座長：鈴木久美
15:00	AnswerCarefully データ作成	鈴木久美	NII-LLMC
15:15	DPOを用いた日本語LLMの安全性向上	勝又智	株式会社レトリバ/東京科学大学
15:30	日本語LLMのガードレール構築に向けて（仮）	金子正弘	MBZUAI
15:45	マルチターン自動レッドチーミングとAISI国際ネットワークの議論（仮）	瀬光孝之	AIセーフティ・インスティテュート
16:00	中国におけるLLMの安全政策と検閲（仮）	伊藤亜聖	東京大学
16:15	慎重な安全性評価	高橋哲朗	鹿児島大学
16:30	パネルディスカッション（２）鈴木久美（司会）
16:55	クロージング	関根聡	NII-LLMC
17:00	終了

申込方法

参加希望はこちらからお願いします
※会場参加は定員50名、先着順

主催

大学共同利用機関法人情報・システム研究機構国立情報学研究所大規模言語モデル研究開発センター（LLMC）

問合せ

国立情報学研究所　大規模言語モデル研究開発センター事務局
E-Mail：llm-kikaku[at]nii.ac.jp