「LLMの安全性シンポジウム2025」
LLMの安全性シンポジウム 2025
本センターが主宰するLLM-jpの安全性WGではLLMの安全性実現に向けた様々な活動を行っています。本シンポジウムは、LLMの安全性に関心を持つ多様な関係者が集い、知見を共有するための初の場として開催します。
本シンポジウムは終了いたしました。ご参加いただいたみなさまに御礼申し上げます。当日の資料を順次、本ページにて公開いたします。
開催日時
2025年7月23日(水)10:00-17:00
会場
東京都千代田区 一橋大学 一橋講堂 中会議場3・4(ハイブリッド開催)
アクセス
開催趣旨
大規模言語モデル(LLM)の開発が日本中で行われていますが、その応用においては安全性への配慮が重要です。国立情報学研究所(NII)の大規模言語モデル研究開発センター(LLMC)が主宰するLLM-jpの安全性WGでは、LLMの安全性実現のための様々な活動を実施しており、AnswerCarefullyなどのデータセットの公開や、AI Safety Instituteとの協力を通じて、アカデミアの立場から日本のLLMの安全性研究を牽引しています。一方、多くの企業でもLLMの安全性の実現への努力がなされ、大学や研究機関でも個別に安全性に関する研究開発が行われています。今後、日進月歩のLLMの安全性を実現していくためには、この問題に関心のある人たちが集結して知見を共有し、社会全体でこの問題に取り組む必要があります。しかし現状、そういった情報共有の場は少なく、まずはこのシンポジウムをキックオフの場として開催し、将来的には多くの方の力を合わせられる方向性を模索していきます。
プログラム・登壇者
| 【午前】AI安全性に関するプロジェクトと企業の動向(1) 座長: 関根聡 | |||
| 10:00 | NII-LLMC安全性WGの活動紹介&安全性シンポジウム開催趣旨 | 関根聡 | NII-LLMC |
| 10:15 | Agentic AI -脅威と緩和策 OWASP Top 10 for LLM Apps & Gen AI Agentic Security Initiative | 築地テレサ | SherLOCK株式会社 |
| 10:30 | AIセーフティ・AIマネジメントを取り巻く国際標準と世界情勢 | 三宅和公 | 住友電気工業株式会社 |
| 10:45 | 先端AIの品質マネジメントについての今後の展望 | 小西弘一 | 国立研究開発法人産業技術総合研究所 |
| 11:00 | 生成AI時代の新たなリスクに対応する“AIトラストとセキュリティ”技術 | 兒島尚 | 富士通株式会社 |
| 11:15 | フェイクニュースの社会課題を解決する偽情報対策技術 | 山本大 | 富士通株式会社 |
| 11:30 | ステレオタイプのレッドチーミングの枠組みをめぐる課題 | 江間有沙 | 東京大学 |
| 11:45 | ライトニングトーク | ||
| 12:00 | 昼食休憩 | ||
| 【午後1】AI安全性に関するプロジェクトと企業の動向(2) 座長: 松田寛 | |||
| 13:00 | 世界のAI安全性の動きとAIセーフティーインスティテュートについて | 村上明子 | AIセーフティ・インスティテュート |
| 13:15 | SB Intuitions Responsible AI Team | 綿岡晃輝 | SB Intuitions株式会社 |
| 13:30 | Preferred NetworksにおけるAIガバナンスの取り組み | 大野健太 | 株式会社Preferred Networks |
| 13:45 | 自動指標に基づくLLMアプリケーションの安全性検証 | 劉弘毅 | 株式会社Citadel AI |
| 14:00 | LLMのステレオタイプ的応答とその類型化の必要性 | 松田寛 | 株式会社リクルート Megagon Labs |
| 14:15 | パネルディスカッション 松田寛(司会) パネリスト 関根聡(国立情報学研究所) 小西弘一(国立研究開発法人産業技術総合研究所) 村上明子(AIセーフティ・インスティテュート) 綿岡晃輝(SB Intuitions株式会社) | ||
| 14:50 | 休憩 | ||
| 【午後2】AI安全性評価と安全性向上技術 座長:鈴木久美 | |||
| 15:00 | AnswerCarefully データセット作成 | 鈴木久美 | NII-LLMC |
| 15:15 | DPOを用いた日本語LLMの安全性向上 | 勝又智 | 株式会社レトリバ/東京科学大学 |
| 15:30 | 日本語LLMのガードレール構築に向けて | 金子正弘 | MBZUAI |
| 15:45 | マルチターン自動レッドチーミングとAISI国際ネットワーク | 瀬光孝之 | AIセーフティ・インスティテュート |
| 16:00 | 中国におけるLLMの安全政策と検閲 | 伊藤亜聖 | 東京大学 |
| 16:15 | 慎重な安全性評価 | 高橋哲朗 | 鹿児島大学 |
| 16:30 | パネルディスカッション(2)鈴木久美(司会) パネリスト 金子正弘(MBZUAI) 瀬光孝之(AIセーフティ・インスティテュート) 高橋哲朗(鹿児島大学) 松田寛(Megagon Labs) | ||
| 16:55 | クロージング | 関根聡 | NII-LLMC |
| 17:00 | 終了 | ||
申込方法
参加希望はこちらからお願いします
※会場参加は定員50名、先着順
※本シンポジウムの受付は終了いたしました。
主催
大学共同利用機関法人情報・システム研究機構 国立情報学研究所 大規模言語モデル研究開発センター(LLMC)
問合せ
LLMの安全性シンポジウム2025運営事務局
(国立情報学研究所 大規模言語モデル研究開発センター内)
E-Mail:llm-jp-safetysympo[at]nii.ac.jp