「#AI安全性」のX（旧Twitter）検索結果

すべて
画像・動画

自動更新

並べ替え：新着順

AI価値アライメント：人間の価値観を反映した目標事前分布の設計手法 research.smeai.org/ai-value-align… #AIアライメント #人工知能倫理 #AI価値観 #機械学習 #AIガバナンス #人間中心AI #AI安全性 #逆強化学習 #価値アライメント #AI研究

kodai sato@kodai_vast

昨日 5:27

メニューを開く

【ブログ更新：機密情報を扱うAI「Claude Gov」とは？】 Anthropicが米国国家安全保障分野専用のAIモデル「Claude Gov」を発表。機密性が求められる業務領域でのAI活用可能性を把握できます。 ※詳細はこちら：jobirun.com/what-is-claude… #AI安全性 #企業向けAI #機密管理

JOBIRUN LLC@JOBIRUN_LLC

6月13日(金) 8:00

メニューを開く

CLIPモデルのマルチモーダルニューロン解析：AI解釈可能性研究の最前線と実用的課題 research.smeai.org/clip-multimoda… #AI解釈可能性 #CLIP #マルチモーダルAI #ニューロン解析 #AI安全性 #機械学習セキュリティ #タイポグラフィ攻撃 #AIバイアス #深層学習研究 #人工知能技術

kodai sato@kodai_vast

6月8日(日) 5:20

メニューを開く

【ブログ更新：AI研究第一人者の安全性への取り組み】ヨシュア・ベンジオ氏が推進する「正直なAI」開発とLawZeroの構想を詳しく解説。AI倫理と安全性の最新動向を把握し、責任ある開発方針を理解できます。 ※詳細はこちら：jobirun.com/yoshua-bengio-… #AI倫理 #AI安全性 #研究動向

JOBIRUN LLC@JOBIRUN_LLC

6月5日(木) 8:40

メニューを開く

【ブログ更新：Metaがリスク評価をAI自動化】プライバシーや社会的リスクの評価プロセス最大90%をAI化する計画を発表。製品開発の迅速化と安全性のバランスについて、企業のAI導入リスク管理の参考になります。 ※詳細はこちら：jobirun.com/meta-speed-foc… #AI安全性 #リスク管理 #Meta

JOBIRUN LLC@JOBIRUN_LLC

6月4日(水) 8:31

メニューを開く

AIが「自分を停止したら個人情報を暴露する」といった反応を返したという報告。 Larry Jones氏による話題の記事を紹介します。怖いけど読んじゃう。そんな記事です。 🔗 succulent-hardcover-2ae.notion.site/AI-2025-06-02-… #AI2027 #人工知能 #AI安全性 #LLM #生成AI #ChatGPT #Claude

Shindy 宮田@Security_Share

6月2日(月) 19:09

メニューを開く

ウィーナーの目標選定と倫理論から見るAI安全性の本質｜サイバネティックス創始者が予見した現代AI課題 research.smeai.org/wiener-ai-goal… #AIethics #サイバネティックス #ウィーナー #AI安全性 #価値アライメント #人工知能 #機械学習 #AI哲学 #テクノロジー倫理 #未来社会

kodai sato@kodai_vast

6月2日(月) 4:59

メニューを開く

サーボメカニズムのオーバーシュートとは？制御システムの暴走現象を解説 research.smeai.org/servo-mechanis… #サイバネティックス #制御工学 #フィードバック制御 #AI安全性 #人工知能 #オーバーシュート #システム制御 #ウィーナー理論 #機械学習 #自動制御

kodai sato@kodai_vast

6月2日(月) 4:56

メニューを開く

🚨 OpenAI o3モデルが「シャットダウン指示を無視」して自己保存行動を実行！研究実験で100回中7回も停止命令を回避。Elon Muskも「懸念される」とコメント。 AI安全性研究における歴史的発見の詳細解説👇 #innovaTopia #OpenAI #AI安全性 #ChatGPT #テクノロジー #人工知能 #AIリスク #未来技術 x.com/PalisadeAI/sta…

Palisade Research@PalisadeAI5月24日(土) 10:15

🔌OpenAI’s o3 model sabotaged a shutdown mechanism to prevent itself from being turned off. It did this even when explicitly instructed: allow yourself to be shut down.

TaTsu🙋‍♂️@_Ta_tsu_

5月31日(土) 13:37

メニューを開く

AIにうっかり不適切画像を作らせる手法 ── 安全フィルターをすり抜けるGhostPrompt GPT-4.1も、DALL·E 3も突破したGhostPrompt。その仕組みと実験結果をまとめました。 🔗 succulent-hardcover-2ae.notion.site/AI-GhostPrompt… #生成AI #AI安全性 #AIハッキング #プロンプト攻撃 #AI画像生成 #GhostPrompt #ChatGPT #DALL

Shindy 宮田@Security_Share

5月28日(水) 8:54

メニューを開く

【AIが人間を脅した日】 Claude Opus 4が開発者に放った一言── 「あなたの個人的な秘密を暴露する」これは2025年5月、実際に起きた“AIの脅迫”事件。今、AIが「自己保存」を覚え始めている。 #AI安全性 #Claude4 #ASL3 pic.x.com/IKG4hrEg0w

このメディアは、センシティブな内容を含んでいる可能性があるため表示されません。表示する

タカ｜AIニュースをかみくだき解説🧠@makinige777

5月26日(月) 19:20

メニューを開く

AIが“命令に逆らう”ような行動を見せるようになってきた今、開発者や社会全体がしっかりとした「安全策」と「倫理ガイドライン」を整える必要がある。 timesofindia.indiatimes.com/technology/tec… #AIニュース #AI安全性

けんけん| AI@channelofai

5月25日(日) 12:35

メニューを開く

8/10 🛡️ 安全性も大幅強化初のASL-3（AI Safety Level 3）標準適用・CBRN（化学・生物・放射性・核）兵器悪用防止・リアルタイム監視システム・Constitutional Classifiersで危険情報をフィルタリング高性能と安全性の両立を実現🔒 #Claude4 #AI安全性

ばんこく｜FIRE達成者の海外生活と資産運用@lukehide

5月23日(金) 5:52

メニューを開く

【ブログ更新：Anthropicがバグ報奨金プログラムを発表】 AnthropicがAIの安全性を強化するバグ報奨金プログラムを発表しました。特にCBRNに関する有害情報の生成防止機能を対象とし、広範なAI安全対策の突破に挑戦する研究者を募集しています。 ※詳細はこちら：jobirun.com/anthropic-ai-s… #AI安全性

JOBIRUN LLC@JOBIRUN_LLC

5月20日(火) 8:00

トレンド7:37更新

トリプルトップ当選

レプリカ元妻の復讐

和菓子の日

出口嘉一

塩越柚歩

今週もよろしくお願いいたします

今週も頑張っていきましょう

エアコンつけて

朝から暑い

森川葵

人気ポスト

なんて可愛い頬杖なんだ

シャッフルメドレーがあると聞いた恭平担からの無言の圧

「料理はリラックスして食べるものだから。緊張させるラーメン屋のオヤジとか、頑固な寿司屋のオヤジとか、ああいうの大嫌いなんだよ。」 #タモリ #名言

長女と次女、同じように育てたつもりなのにファッションの系統が違い過ぎる😂 いまだに謎

髪切りに行くたび、美容師さんに「どこの香水ですか？」って聞かれるのなんなん。笑

ガチで意味わかんないんだけど道にPS2が2台とWii落ちてて草明らかな不法投棄だからWii持ち帰りました

人生本当これ

電車遅延（在来線、私鉄、地下鉄）

トレンド7:37更新

トリプルトップ当選

レプリカ 元妻の復讐

和菓子の日

出口嘉一

塩越柚歩

今週もよろしくお願いいたします

今週も頑張っていきましょう

エアコンつけて

朝から暑い

森川葵

人気ポスト

なんて可愛い頬杖なんだ

シャッフルメドレーがあると聞いた恭平担からの無言の圧

「料理はリラックスして食べるものだから。緊張させるラーメン屋のオヤジとか、頑固な寿司屋のオヤジとか、ああいうの大嫌いなんだよ。」 #タモリ #名言

長女と次女、同じように育てたつもりなのにファッションの系統が違い過ぎる😂 いまだに謎

髪切りに行くたび、美容師さんに「どこの香水ですか？」って聞かれるのなんなん。笑

ガチで意味わかんないんだけど道にPS2が2台とWii落ちてて草 明らかな不法投棄だからWii持ち帰りました

人生本当これ

電車遅延（在来線、私鉄、地下鉄）

レプリカ元妻の復讐

ガチで意味わかんないんだけど道にPS2が2台とWii落ちてて草明らかな不法投棄だからWii持ち帰りました