- すべて
- 画像・動画
自動更新
並べ替え:新着順
ベストポスト
メニューを開く![](https://rts-pctr.c.yimg.jp/BgIFgYJGVIVv8u0nVJvw8B2FauAYMF4jOP5zFJAV4i5e72TLbER0xQeK1l8ZZ0OLgl0tOFl6lAr8z8MXHVZvfcoQBLj0P17FW9XcEwmhow3JFBs1STDDwbdIjseNv4rsbSGFk1H72-kufQEVdq7gMQXJK6c6Msqtatr5gOo375guLYvXduzQ5wGxo1Fkek762UYy5Q0bAz1rs_rh2aA1aodTeEJCZKIzXXz9jqfcad0=)
Google DeepMind が WARP を発表: 人間のフィードバックから新しい強化学習を行う RLHF 手法で LLM を調整し、KL 報酬パレート解フロントを最適化 - MarkTechPost #RLHF #ModelMerging #WARP #AIAlignment prompthub.info/21933/
メニューを開く![](https://rts-pctr.c.yimg.jp/BgIFgYJGVIVv8u0nVJvw8B2FauAYMF4jOP5zFJAV4i5e72TLbER0xQeK1l8ZZ0OLgl0tOFl6lAr8z8MXHVZvfcoQBLj0P17FW9XcEwmhow3JFBs1STDDwbdIjseNv4rsbSGFk1H72-kufQEVdq7gMQXJK6c6Msqtatr5gOo375guLYvXduzQ5wGxo1Fkek762UYy5Q0bAz1rs_rh2aA1aodTeEJCZKIzXXz9jqfcad0=)
OpenAI が ChatGPT のエラーをキャッチする CriticGPT を作成 - IEEE Spectrum #CriticGPT #AIalignment #RLHF #CriticAI prompthub.info/21446/
メニューを開く![](https://rts-pctr.c.yimg.jp/BgIFgYJGVIVv8u0nVJvw8B2FauAYMF4jOP5zFJAV4i5e72TLbER0xQeK1l8ZZ0OLgl0tOFl6lAr8z8MXHVZvfcoQBLj0P17FW9XcEwmhow3JFBs1STDDwbdIjseNv4rsbSGFk1H72-kufQEVdq7gMQXJK6c6Msqtatr5gOo375guLYvXduzQ5wGxo1Fkek762UYy5Q0bAz1rs_rh2aA1aodTeEJCZKIzXXz9jqfcad0=)
OpenAI の新しい「CriticGPT」モデルは、GPT-4 の出力を批判するようにトレーニングされています | Ars Technica #CriticGPT #AIalignment #RLHF #ChatGPT prompthub.info/21248/
メニューを開く![](https://rts-pctr.c.yimg.jp/BgIFgYJGVIVv8u0nVJvw8B2FauAYMF4jOP5zFJAV4i5e72TLbER0xQeK1l8ZZ0OLgl0tOFl6lAr8z8MXHVZvfcoQBLj0P17FW9XcEwmhow3JFBs1STDDwbdIjseNv4rsbSGFk1H72-kufQEVdq7gMQXJK6c6Msqtatr5gOo375guLYvXduzQ5wGxo1Fkek762UYy5Q0bAz1rs_rh2aA1aodTeEJCZKIzXXz9jqfcad0=)
MAGPIE: 何もせずにアライメントされた LLM をプロンプトすることで大規模なアライメント データを生成する自己合成手法 - MarkTechPost #LLM #MAGPIE #instructiondatasets #AIalignment prompthub.info/16637/
メニューを開く![](https://rts-pctr.c.yimg.jp/BgIFgYJGVIVv8u0nVJvw8B2FauAYMF4jOP5zFJAV4i5e72TLbER0xQeK1l8ZZ0OLgl0tOFl6lAr8z8MXHVZvfcoQBLj0P17FW9XcEwmhow3JFBs1STDDwbdIjseNv4rsbSGFk1H72-kufQEVdq7gMQXJK6c6Msqtatr5gOo375guLYvXduzQ5wGxo1Fkek762UYy5Q0bAz1rs_rh2aA1aodTeEJCZKIzXXz9jqfcad0=)
Alinia AI、生成AIの安全な展開のために240万ドルを調達 - Tech.eu #GenerativeAI #AIAlignment #AIRegulation #LLMGovernance prompthub.info/12106/