「LLMの安全性シンポジウム2025」

イベント

LLMの安全性シンポジウム 2025

本センターが主宰するLLM-jpの安全性WGではLLMの安全性実現に向けた様々な活動を行っています。本シンポジウムは、LLMの安全性に関心を持つ多様な関係者が集い、知見を共有するための初の場として開催します。

本シンポジウムは終了いたしました。ご参加いただいたみなさまに御礼申し上げます。当日の資料を順次、本ページにて公開いたします。

開催日時

2025年7月23日(水)10:00-17:00

会場

東京都千代田区 一橋大学 一橋講堂 中会議場3・4(ハイブリッド開催)
アクセス

開催趣旨

大規模言語モデル(LLM)の開発が日本中で行われていますが、その応用においては安全性への配慮が重要です。国立情報学研究所(NII)の大規模言語モデル研究開発センター(LLMC)が主宰するLLM-jpの安全性WGでは、LLMの安全性実現のための様々な活動を実施しており、AnswerCarefullyなどのデータセットの公開や、AI Safety Instituteとの協力を通じて、アカデミアの立場から日本のLLMの安全性研究を牽引しています。一方、多くの企業でもLLMの安全性の実現への努力がなされ、大学や研究機関でも個別に安全性に関する研究開発が行われています。今後、日進月歩のLLMの安全性を実現していくためには、この問題に関心のある人たちが集結して知見を共有し、社会全体でこの問題に取り組む必要があります。しかし現状、そういった情報共有の場は少なく、まずはこのシンポジウムをキックオフの場として開催し、将来的には多くの方の力を合わせられる方向性を模索していきます。

プログラム・登壇者

【午前】AI安全性に関するプロジェクトと企業の動向(1) 座長: 関根聡
10:00NII-LLMC安全性WGの活動紹介&安全性シンポジウム開催趣旨関根聡NII-LLMC
10:15Agentic AI -脅威と緩和策
OWASP Top 10 for LLM Apps & Gen AI Agentic Security Initiative
築地テレサSherLOCK株式会社
10:30AIセーフティ・AIマネジメントを取り巻く国際標準と世界情勢三宅和公住友電気工業株式会社
10:45先端AIの品質マネジメントについての今後の展望小西弘一国立研究開発法人産業技術総合研究所
11:00生成AI時代の新たなリスクに対応する“AIトラストとセキュリティ”技術兒島尚富士通株式会社
11:15フェイクニュースの社会課題を解決する偽情報対策技術山本大富士通株式会社
11:30ステレオタイプのレッドチーミングの枠組みをめぐる課題江間有沙東京大学
11:45ライトニングトーク
12:00昼食休憩
【午後1】AI安全性に関するプロジェクトと企業の動向(2) 座長: 松田寛
13:00世界のAI安全性の動きとAIセーフティーインスティテュートについて村上明子AIセーフティ・インスティテュート
13:15SB Intuitions Responsible AI Team綿岡晃輝SB Intuitions株式会社
13:30Preferred NetworksにおけるAIガバナンスの取り組み大野健太株式会社Preferred Networks
13:45自動指標に基づくLLMアプリケーションの安全性検証 劉弘毅株式会社Citadel AI
14:00LLMのステレオタイプ的応答とその類型化の必要性松田寛株式会社リクルート Megagon Labs
14:15パネルディスカッション 松田寛(司会)
 パネリスト
  関根聡(国立情報学研究所)
  小西弘一(国立研究開発法人産業技術総合研究所)
  村上明子(AIセーフティ・インスティテュート)  
  綿岡晃輝(SB Intuitions株式会社)  
14:50休憩
【午後2】AI安全性評価と安全性向上技術 座長:鈴木久美
15:00AnswerCarefully データセット作成鈴木久美NII-LLMC
15:15DPOを用いた日本語LLMの安全性向上勝又智株式会社レトリバ/東京科学大学
15:30日本語LLMのガードレール構築に向けて金子正弘MBZUAI
15:45マルチターン自動レッドチーミングとAISI国際ネットワーク瀬光孝之AIセーフティ・インスティテュート
16:00中国におけるLLMの安全政策と検閲伊藤亜聖東京大学
16:15慎重な安全性評価高橋哲朗鹿児島大学
16:30パネルディスカッション(2)鈴木久美(司会)
 パネリスト
  金子正弘(MBZUAI)
  瀬光孝之(AIセーフティ・インスティテュート)
  高橋哲朗(鹿児島大学)
  松田寛(Megagon Labs)
16:55クロージング関根聡NII-LLMC
17:00終了

申込方法

参加希望はこちらからお願いします
※会場参加は定員50名、先着順

※本シンポジウムの受付は終了いたしました。

主催

大学共同利用機関法人情報・システム研究機構 国立情報学研究所 大規模言語モデル研究開発センター(LLMC)

問合せ

LLMの安全性シンポジウム2025運営事務局
(国立情報学研究所 大規模言語モデル研究開発センター内)
E-Mail:llm-jp-safetysympo[at]nii.ac.jp