「LLMの安全性シンポジウム2025」

イベント

LLMの安全性シンポジウム 2025

本センターが主宰するLLM-jpの安全性WGではLLMの安全性実現に向けた様々な活動を行っています。本シンポジウムは、LLMの安全性に関心を持つ多様な関係者が集い、知見を共有するための初の場として開催します。

開催日時

2025年7月23日(水)10:00-17:00

会場

東京都千代田区 一橋大学 一橋講堂 中会議場3・4(ハイブリッド開催)
アクセス

開催趣旨

大規模言語モデル(LLM)の開発が日本中で行われていますが、その応用においては安全性への配慮が重要です。国立情報学研究所(NII)の大規模言語モデル研究開発センター(LLMC)が主宰するLLM-jpの安全性WGでは、LLMの安全性実現のための様々な活動を実施しており、AnswerCarefullyなどのデータセットの公開や、AI Safety Instituteとの協力を通じて、アカデミアの立場から日本のLLMの安全性研究を牽引しています。一方、多くの企業でもLLMの安全性の実現への努力がなされ、大学や研究機関でも個別に安全性に関する研究開発が行われています。今後、日進月歩のLLMの安全性を実現していくためには、この問題に関心のある人たちが集結して知見を共有し、社会全体でこの問題に取り組む必要があります。しかし現状、そういった情報共有の場は少なく、まずはこのシンポジウムをキックオフの場として開催し、将来的には多くの方の力を合わせられる方向性を模索していきます。

プログラム・登壇者

【午前の部】AI安全性に関するプロジェクトと企業の動向(1) 座長: 関根聡
10:00LLM-jp安全性WGの紹介関根聡NII-LLMC
10:15Agentic AIの脆弱性と緩和策について(仮)築地テレサSherLOCK株式会社
10:30AIセーフティ・AIマネジメントを取り巻く国際標準と世界情勢(仮)三宅和公住友電気工業株式会社
10:45AIセーフティリスクの中期的見立て(仮)小西弘一国立研究開発法人産業技術総合研究所
11:00生成AI時代の新たなリスクに対応する“AIトラストとセキュリティ”技術兒島尚富士通株式会社
11:15フェイクニュースの社会課題を解決する偽情報対策技術山本大富士通株式会社
11:30ステレオタイプのレッドチーミングの枠組みをめぐる課題(仮)江間有沙東京大学
11:45ライトニングトーク
12:00昼食休憩
【午後1】AI安全性に関するプロジェクトと企業の動向(2) 座長: 松田寛
13:00世界のAI安全性の動きとAIセーフティーインスティテュートについて村上明子AIセーフティ・インスティテュート
13:15SB Intuitionsの安全性チーム綿岡晃輝SB Intuitions株式会社
13:30Preferred NetworksにおけるAIガバナンスの取り組み(仮)大野健太株式会社Preferred Networks
13:45LLMアプリケーションの安全性検証 (仮)劉弘毅株式会社Citadel AI
14:00LLMのステレオタイプ的応答とその類型化の必要性松田寛株式会社リクルート Megagon Labs
14:15パネルディスカッション 松田寛(司会)
14:50休憩
【午後2】AI安全性評価と安全性向上技術 座長:鈴木久美
15:00AnswerCarefully データ作成鈴木久美NII-LLMC
15:15DPOを用いた日本語LLMの安全性向上勝又智株式会社レトリバ/東京科学大学
15:30日本語LLMのガードレール構築に向けて(仮)金子正弘MBZUAI
15:45マルチターン自動レッドチーミングとAISI国際ネットワークの議論(仮)瀬光孝之AIセーフティ・インスティテュート
16:00中国におけるLLMの安全政策と検閲(仮)伊藤亜聖東京大学
16:15慎重な安全性評価高橋哲朗鹿児島大学
16:30パネルディスカッション(2)鈴木久美(司会)
16:55クロージング関根聡NII-LLMC
17:00終了

申込方法

参加希望はこちらからお願いします
※会場参加は定員50名、先着順

主催

大学共同利用機関法人情報・システム研究機構 国立情報学研究所 大規模言語モデル研究開発センター(LLMC)

問合せ

国立情報学研究所 大規模言語モデル研究開発センター事務局
E-Mail:llm-kikaku[at]nii.ac.jp