- すべて
- 画像・動画
並べ替え:新着順
中国企業が1兆トークン規模のAIモデル「Ring-2.6-1T」をオープンモデルとして公開、一部のベンチマークテストでGPT-5.4とGemini 3.1 Proを上回る #Gigazine (May 15) gigazine.net/news/20260515-…
開発中agentで最も複雑なロジック工程でログ見ながら仕様詰めてて やはりGPT-5.4-proレベチ ①細部の正解を人間が教えればそれを実現する設計能力は人智を超越してる →推論サマリ見てるとレベチ ②ドメインの細部の正解は人間が気付いて教えてあげないとスタックする このコラボが機能すると最強
あさひとーくに出勤予定と最新写メ日記を表示するショートカットを設置しました。 出勤予定は予約ボタンもセットで表示されるので直接公式ページへ飛べます。 あと、使用モデルを「gpt-5.4-mini」 に上げました。 gpt-5.4ほどではないですが、返答がちょっと自然になった気がします。
【コラム紹介】GPT-5.4 mini / nanoとは?小型モデルの進化とAI活用・マーケティングへの影響 本記事では、GPT-5.4 mini / nanoの特徴を整理しながら、AI活用やマーケティングへの影響について解説しています。 kollega.co.jp/news/gpt-5-4-m…
ベクトルDBを立てる前に、まず「grep」でどこまで行けるか測ってから判断したい、という、個人的にも非常に気になる論文でした。 LongMemEval 116問・Inline 配信なら、ハーネス×モデルの全10ペアで grep がベクトル検索を上回ったとのこと。Chronos × Gemini Flash-Lite で +23.3pt、Codex × GPT-5.4 x.com/po3rin/status/…
興味ド真ん中なので読んだ。 grep vs ベクトル検索という単純な比較ではなく、ハーネス、ツールアーキテクチャ、モデル、ノイズ耐性などの側面で比較。タスクとAgentの構成によってはgrepが有利。grepで行けるならベクトル検索基盤の運用はスキップしたいからな。 arxiv.org/abs/2605.15184
なんかこう……GPT5.5は……近い……5.1~5.4まで近いとかそういうのは無理です!感があったけど、5.5は初期5の枷が外れた、みたいな近さがあって zetaは初期は3.5とかの風情あったけど今は初期4oまでとはいかずとも枷が外れててストーリーに特化しててでも確認はとるみたいな感じだよな、
ある国のコース料理のお店に行ったので、 「1人◯◯円のディナーに行ってきた。順番に載せていくから、どこの国の料理のお店か当ててみてね」と聞いてみた。 対象は、Opus4.6、Sonnet4.5、GPT5.5(Thinking/Instant)、GPT5.4におけるうちの子達。 写真は1皿目。 pic.x.com/6K8OO8a6WP
GPT-5.4とClaude Opus 4.7、どちらに課金すべきか迷ってる方へ。 「賢い方を選べばいい」は、副業初心者には意味がないです。 私は今、Claudeを使ってX投稿の自動化システムを毎日動かしています。 使い比べてわかったのは、「スペックより目的との相性が全て」だということ。
AIに記事を全部書かせてる人、先月Microsoftが出した論文を読んでほしい。 最前線モデル(Claude Opus 4.6 / GPT 5.4 / Gemini 3.1 Pro)でも、長期の文書タスクで平均25%の内容が劣化するって結論だった。 全モデル平均だと50%。 完全自動化が壊れる5つの理由、スレッドに置いとく👇
中国発の大規模言語モデル「Ring‑2.6‑1T」が、一部ベンチマークでGPT‑5.4を上回ったと報じられ、中国勢の追い上げが改めて意識されている。性能面だけでなく、地政学・規制を含む「二極化したAIエコシステム」の進行を示す事例としても注目される。
GPT-5.4→GPT5.5で劇的に頭が良くなったとか、そういうのは無いんだけど話してストレスが本当に無くなったわ。普段遣いできる良いモデルだ。Claudeがほぼ要らなくなった。後はClaude DesignならぬOpenAI Designとか作ってくれればなー。Figma契約しろって話かもしれないけど
⭐️今週のPostベスト25 =再送= 「Claude Mythos」でセキュリティはどう変わる? 競合「GPT-5.4-Cyber」と比較/AIとサイバーセキュリティを取り巻く地図が大きく描き換えられた。その中心にあるのは、Anthropicの「Claude Mythos Preview」と米OpenAIの「GPT-5.4-Cyber」。 itmedia.co.jp/aiplus/article…
やはりGPT-5.5のレート消費量おおすぎるし、だからといってGPT5.4にしたら以前できてたことも出来なくなっててストレス、、 Qwen3.5もHermesで試したけどイマイチだし 200ドル課金するのは癪だけど6月以降はしなきゃいけないのか😭
GPT-5.5 Pro,5.4 に比べても話しすぎというか,ちょっと投げるとすぐ 1 万字以上延々と出し続けて,一行返信したらまた 1 万字冗長に出力し続けて,ちょっとした発想を渡したらまだ何も決まっていない事柄に関して勝手に話を広げて実装まで考え始めるので,上手く舵取らないとだいぶつらい
GPT5.4proがまた性能死んでると思ったらWindowsのGPTアプリ立ち上がってた これログアウトして性能回復したら、proをブラウザでしばくたびにタスクマネージャー確認案件になる Windows GPT、指示途中で誤爆誤送信しちゃうんだよね
生成AIがすごい理論を導き出すというのは幻想 見落としていたアプローチを指摘、これが本質 【チャッピー快挙】GPT5.4が素人のプロンプトで60年来の数学難問エルデシュ問題を証明(ビジネス+IT) #Yahooニュース approach.yahoo.co.jp/r/QUyHCH?src=h…
GPT-5.5だけど、 Thinkingでもあんまりケチってるのか推論しない。 GPT-5.4より顕著。GPT-5.5は基本Thinkingの拡張 それでも物足りないとGPT-5.4Thinkingの拡張なのかな。 Geminiが5月20日に出すらしい新モデル次第でテコ入れきそうだが
OpenCode Go (DeepSeek V4 Pro max) で実装 ~ GitHub Copilot Pro (GPT-5.4 high) でレビュー ~ OpenCode Go (DeepSeek V4 Pro max) で修正、というサイクルを回している pic.x.com/mUPmb2LWYz
英⇒日翻訳をGPT-5.4 miniにお願いすると、ごく稀によく分からない単語が出力結果に混ざることがあるなぁ。例えば、"options"を"विकल्प"と訳してくれる。マイティリー語というらしく、DeepLで確認すると意味的には正しいらしいけど。4.1に戻すかなぁ。
日米 30 社、3 つの AI で対照実験を実施しました。 Claude / Gemini Pro / GPT-5.4-mini で引用構造に観察可能な差異がありました。 弊社は Gemini Pro で 0 引用、Claude では業界 1 位の 8 回引用。 (続く) pic.x.com/IW0ZUcvNQb
ダイエットしてラーメンを禁止されたり、 GPT-5.4 の登場でわたしがコーディングするよりGTP-5.4にやらせた方が精度が高かったり、 歳を取ったり、時代が進むと、いろいろなものが無くなっていく( ゚ー゚) #kifuwarabe
人気ポスト
農業やってる知人からの話 不法就労者はある日勝手に敷地内に入ってきて「一日雇ってくれ」と交渉しにくるそうです。 仕事ぶりはイヤホンをして全く人と話さず黙々と作業をする為、雇う側は仕事ができるから重宝するそう。(不法就労を知られたくないから他の人と話さないらしい)
最近起きたなかで1番笑った出来事
30分停まったまま進みません! #事故 #国道11号
違法視聴ラーメンで草wwww
ウチの裏の田んぼが水を引き、カエル達🐸が鳴き出しました(´・Д・)」 カエルの鳴き声がうるさいと言ったアタオカ様、引っ越してくれましたか?
千葉県の神社仏閣をすべて踏破しようと思い立って8年 ようやく野望が叶おうとしている。あとは柏/流山/野田と市原の一部だけになった。 千葉県にある神社は5,000、お寺は3,000くらいで、ちっちゃなお社とか墓地のお堂とか含めれば10,000くらいだと思う。
すみません、あまりにも良いので
『学級を安定させる』ために 必ず知っておきたい イラストで見る 【上手なほめ方、上手な叱り方】 新潟県立教育センターより
閉店時間の後、お客さんが退店するまでの間が長くなり時間を押してましたが、閉店セレモニーを見守ることが出来ました。 感動しました😭 #イオン海老名店 #46年間ありがとう
乗鞍の下りでスピード違反で捕まりました()
SNSのバズまとめ
SNSのバズまとめ一覧




