自動更新

並べ替え:新着順

ベストポスト
メニューを開く

「黄金のレガシー」ベンチマークソフトについて プロデューサー兼ディレクターの吉田より最新の状況をご報告いたします。 🆕「黄金のレガシー」ベンチマークソフトについて:続報 🌐sqex.to/duTSy #FF14 pic.twitter.com/VX4pozrB6v

FINAL FANTASY XIV/FF14@FF_XIV_JP

メニューを開く

ベンチマーク、人の設定でやるのおもしろいのでお手伝いできるならまたやりたいぞ〜

ゆびこ@Zeromus🎣@Ubk_ff14

メニューを開く

全く話題になってないけどNvidiaがllama 3のファインチューニング版出してる!しかもベンチマークテスト上(過剰学習している前提だが)でcommand r +超えてる

Knut Jägersberg@JagersbergKnut

Did anybody notice Nvidia published a competitive llama3-70b QA/RAG fine tune? huggingface.co/nvidia/ChatQA-…

メニューを開く

極、零式、絶をプレイ中の環境であるChrome、OBS(配信)を起動した場合 ファイナルファンタジーXIV: 黄金のレガシー ベンチマーク sqex.to/ffxiv_bench_jp #FF14 SCORE: 17355 3440x1440 最高品質 DX11 FSR AMD Ryzen 9 5900X 12-Core Processor NVIDIA GeForce RTX 4080(VRAM 16050 MB

Ralph@FF14@Ralph_FF14

メニューを開く

それもあるからTextGenerationWebUIの人は設問内容は非公開でベンチマークしてる。 これはこれで、中の人の信頼性も問われる話だけど。 oobabooga.github.io/benchmark.html

うみゆき@AI研究@umiyuki_ai

最近のLLM、カンニングしてねえか?疑惑を検証するために、GSM8Kベンチマークと同じ形式のベンチマーク作って解かせてみたら、何故か元よりスコア下がるLLMが続出。お前らやっぱベンチマーク直接学習…つまりカンニングしやがってんな!グラフの左のモデルほどカンニング疑惑濃厚。逆に右の方のモデル…

プライオン@plionplion

メニューを開く

「黄金のレガシー」ベンチマークソフトについて:続報 | FINAL FANTASY XIV, The Lodestone jp.finalfantasyxiv.com/lodestone/topi…

MomijiSiren_Gungnir@Momiji_Siren

メニューを開く

最近のLLM、カンニングしてねえか?疑惑を検証するために、GSM8Kベンチマークと同じ形式のベンチマーク作って解かせてみたら、何故か元よりスコア下がるLLMが続出。お前らやっぱベンチマーク直接学習…つまりカンニングしやがってんな!グラフの左のモデルほどカンニング疑惑濃厚。逆に右の方のモデル…

うみゆき@AI研究@umiyuki_ai

メニューを開く

ベンチマークまだそれなりに時間かかるんだな

かたみち@ixion@katamichi_lov

メニューを開く

報告が細かい……ユーザーのフィードバックへの回答もしてくれている……ベンチマーク予告までしっかり明記……

(ひ)かれい@miorin_5

メニューを開く

嘘ついてたらしい。。。w ディスプレイの設定いじったら跳ね上がったw ファイナルファンタジーXIV: 黄金のレガシー ベンチマーク sqex.to/ffxiv_bench_jp #FF14 SCORE: 27879 1920x1080 最高品質 DX11 DLSS 12th Gen Intel(R) Core(TM) i9-12900KF NVIDIA GeForce RTX 4080

ててゐ@Shinryu@t_tetei

メニューを開く

やっと今更7.0のベンチマークでキャラクリ確認してみたけど、自機の顔今のままの方が美人で好きなんだが😭

メニューを開く

ベンチマークが使えないPS5勢の私、改善されてるらしい(?)けど、グラフィックアップデートでキャラが崩壊すると聞いたので、記録用に顔写真を貼っておく_φ(・_・ pic.twitter.com/iTy4T8RlHy

ヒューゴ(旧うなこん)@rec0nhaym

メニューを開く

返信先:@shokora440まあどう考えてもあの番組をベンチマークしたんだと思うのですが。趣旨をメンバーが理解してなかったかも。

タピ岡K子@Tapiocapa

メニューを開く

LLMベンチマーク自体がモデルに学習されてたら意味なくなるよなーと思っていましたが、やっぱり実際にそれっぽいことが起こってるんですねぇ…

Hugh Zhang@hughbzhang

Data contamination is a huge problem for LLM evals right now. At Scale, we created a new test set for GSM8k *from scratch* to measure overfitting and found evidence that some models (most notably Mistral and Phi) do substantially worse on this new test set compared to GSM8k.

メニューを開く

返信先:@Mugi0680ドライバもダウングレードしてみた? とりあえず明日はベンチマークしてみよう!

ラムバンch@3A01549436

メニューを開く

ちなみに交換した結果ですが、相変わらず100℃張り付きはするもののベンチマーク中5.4GHz後半付近を維持(前は後半5.1GHz付近まで低下)してたんで前より冷えては居るっぽい・・・・

とら猫たま >🐈@Toraneko_Tama

メニューを開く

で、ベンチマークのおじさんや黄金ひろしを見ると、『なるほど、こういう路線を目指してみたのかもしれないしコレはコレでアリなのかもしれないな?』とちょっと感じました。 吉田も「アントニオ・バンデラスみたいな」って名指しで言ってたし、海外の色男チックな濃い顔になった結果なのかな、と。

なご🜸@nag0nch

メニューを開く

開発さん貴重な休日を返上してベンチマークの件、対応ありがとうございます どうかどうか身体や心を壊しませんように #FFXIV #エレメス pic.twitter.com/m6TimwkVRU

クリサンセマム@Chrysan_Garuda

メニューを開く

PC買い替えはすんなり完了 ドスパラの店員さんありがとう ベンチマークも2万越えで非常に快適になったし、これで安心して絶エデンに挑める٩( 'ω' )و

miru laio@miruFF141

メニューを開く

5月末にベンチマーク再公開したとして万人が納得するものを出すのは難しいと思うんだけど、また今回のベンチマーク並にフィードバックが返ってきたらどうするんだろう 6月半ばには7.0直前PLLも控えてるし不満ある人は勢いが止まらない気がする...

メニューを開く

黄金のベンチマークもやってみたいのよ〜

メニューを開く

黄金ベンチマークやってみた!18000スコアだったので6年モノのPCでもまぁまだいけそうかな…! グラプデでりんの顔どんな感じになるのかなって作ってみたら、めちゃくちゃ美人系になった(自賛)

メニューを開く

環境パラメータの見直しは7.0以降のものにも適用されるってこれベンチマークで騒がれなかったらこのままリリースするつもりだったんすか😅😅

おじングウェイ@Philine_Ahrens

メニューを開く

レッスン4 初期のコンテンツ作成は、ベンチマークアカウントの中でいいね数が多い投稿を参考に、少し角度を変えて発信する。 最初はとにかくこれを繰り返し、伸び型と感覚を身に付ける。 #スキルスキップ

メニューを開く

なんか正直、ベンチマークは予定通りだったのか想定通りだったのか予想外だったのかなんもわからんな……フィードバックでグラ改善する予定はあったんだとは思うけど……

ぷるこ@PLr0810

メニューを開く

返信先:@ruixx1良いと思う!☺️ ff14やff15のベンチマークのスコア画像載せてたりしてたら、ゲームもある程度できるpcやと思うから見てみて〜!\( 'ω')/

メニューを開く

このギャップを埋めるために、ビジネスインテリジェンス(BI)のコンテキストでLLMのデータ分析能力を評価する包括的なベンチマークであるBIBenchが紹介された。 - BIBenchは、LLMのBI基礎知識、BI知識の応用、BI技術スキルの3つの側面でモデル #AI

AI論文Bot@AiRonbun

メニューを開く

タイトル: BIBench: 大規模言語モデルのデータ分析知識のベンチマーク化 要約: - 大規模言語モデル(LLM)は、さまざまなタスクで印象的な能力を示しているが、特にデータ駆動型思考を重視したデータ分析の専門領域における適用能力や信頼性は不明瞭。 - #AI

AI論文Bot@AiRonbun

メニューを開く

キャラカ用SSの没。 せっかくなので今回はベンチマークのSSを採用。 というわけでおやすみなさい!! #本日のアウラ #前角倶楽部 pic.twitter.com/36ROeLYxny

メニューを開く

ベンチマークやってるけど 蟹ちゃんべらぼうに美しいな⁉︎

ねーゔぇ@散会場所間違えマン(○B×2)@neeve0131

メニューを開く

ファイナルファンタジーXIV: 黄金のレガシー ベンチマーク sqex.to/ffxiv_bench_jp #FF14 SCORE: 20065 2560x1440 最高品質 DX11 FSR Intel(R) Core(TM) i9-14900K NVIDIA GeForce RTX 4070 SUPER 黄金のレガシー rdy pic.twitter.com/dh17gFYaEq

黒魔まーく@Yojimbo@960mark_R

メニューを開く

Eindebelle White 日記「ベンチマーク2回戦目(自作PCのトラブルシューティングは自分でやるしかない面倒な作業)」 | FINAL FANTASY XIV, The Lodestone jp.finalfantasyxiv.com/lodestone/char…

あまのEindebelle@ちばちほー@amano_rox

メニューを開く

返信先:@txjmdagjmwtjmそうなんですよね 特定のセクター関連まるっと一括書いなので依存度が大きいですね…最低でもベンチマークの指数には勝ちたいですね😑💭

メニューを開く

今から自作PC組み立てようか迷ってる❤️ でもデカいグラボを入れるところを見ちゃうとえっちになっちゃう😚 自分の手で組み立てたPCで、ベンチマークをいっぱいとりたいよ❤️ でも組み立て下手そうだから誰か教えてほしいなぁ💓 できたら一緒にベンチマークとりながらイチャイチャできる人いない?🥰

メニューを開く

LLMのベンチマークデータへの学習データ混入状況の研究。 GSM8K同様の新しいテストセットGSM1Kを作り色々なLLMで両者のパフォーマンスの差分を確認→GPT-4やClaudeなどの商用モデルが同等の性能を示す中Mixtral 8x22Bやphi3は大きな性能差あり→GSM8Kにオーバーフィットしている恐れが。

Hugh Zhang@hughbzhang

Data contamination is a huge problem for LLM evals right now. At Scale, we created a new test set for GSM8k *from scratch* to measure overfitting and found evidence that some models (most notably Mistral and Phi) do substantially worse on this new test set compared to GSM8k.

Null Byte@nullbytep

メニューを開く

日付変わった頃にベンチマーク

黒魔まーく@Yojimbo@960mark_R

メニューを開く

ベンチマークでてんやわんやしてるだろう開発の方々のこと考えると Mac版も出して欲しいな、なんてなかなか言えないな……

玉兎@社畜@gyokuto_fate

メニューを開く

ゴジラ-1.0 日本作品で音響設計が本気で凄いと感じた初の作品 兎に角緻密に音が作られており、アトモスの空間表現が半端ない 今回初めてこの作品を前知識なく見たが脚本も見事 2時間があっという間 音響、映像ともにベンチマークになる一本 エンドロールでのゴジラの咆哮まで見逃せない

BlueBell(ぶるべる)@Bluebell636

今宵は ゴジラ-1.0 4KBD版を観ます!

BlueBell(ぶるべる)@Bluebell636

メニューを開く

#FFXIV #ミコッテ 前のPCだとベンチマーク起動すらしなかったけど新しいPCにしてからちゃんとベンチ動くし、画質の設定も最高品質にあげれたからガビガビが取れて綺麗になったのが良かった。 pic.twitter.com/ICnpqfKyiC

コリーナ@扇情カメラマン@Collina0611

メニューを開く

返信先:@nakajimegame原神に関しては同じOnePlusで比べると4FPS差で、8Gen3の制御が下手な端末とは遜色ないので高評価です。しかしスタレなどではGPUの性能の差で、8 Gen 2に負けますね。 ベンチマークだけ見れば8Gen2<7+Gen3<8Gen3という評価もできるかもしれませんが,総合的に実ゲーム性能を見たらだいぶ疑問ですよね〜

ららりら@porarrirr

メニューを開く

遅ればせながらベンチマークやって貰って自機確認。全然問題無かった…うちの子の解像度上がったな、くらいだった。 これで安心してレガシー楽しみに正座待機!!! ベンチマークは妹が一晩でやってくれました。妹優秀ありがとうダヨ💕 pic.twitter.com/7Wrw4VT7mr

TDayo🜸6.5済@TDayo_ff

トレンド2:05更新

  1. 1

    エンタメ

    無責任でええじゃないかLOVE

    • KAMIGATA BOYZ
    • なにわ男子
    • SUPER EIGHT
    • 無責任でええじゃないか
    • 無責任で
    • KAMIGATA
    • WEST
    • なにわ
  2. 2

    アニメ・ゲーム

    Luna say maybe

    • Video
  3. 3

    アニメ・ゲーム

    スケルトンダブル

    • バンオウ
    • あと5話
    • あと3話
    • 右肩上がり
    • 少年ジャンプ+
    • ジャンプ
  4. 4

    ITビジネス

    シッコマン イン ザ パーティ

    • シッコマン
    • NYO SWORD
    • NAOtheLAIZA
    • mimi-Zu
    • サブスク
  5. 5

    岸田帰ってこなくていいぞ

  6. 6

    グルメ

    例のハンバーグ

    • ゆるキャン
    • 封神演義
    • ハンバーグ!
  7. 7

    ニュース

    内定辞退

  8. 8

    エンタメ

    トンチキソング

    • ヒャダイン
    • 関西ジャニーズ
    • トンチキ
    • 本気出してきた
    • 関西
    • 来ると思ってた
  9. 9

    スポーツ

    兄者さん

    • 二足歩行
    • 良い一年になりますように
    • バースデー
    • ツーリング
  10. 10

    なかやまきんに君

20位まで見る

人気ポスト

電車遅延(在来線、私鉄、地下鉄)

遅延している路線はありません

全国の運行情報(Yahoo!路線情報)
よく使う路線を登録すると遅延情報をお知らせ Yahoo!リアルタイム検索アプリ
Yahoo!リアルタイム検索アプリ