自動更新

並べ替え：新着順

ベストポスト

オプトインでやれば文句ないよってたぶん１００回ぐらいいってんじゃないでさぁ日本の生成AI開発なんてさファインチューニングしかやってないんだよ基盤モデルの開発なんかしてないから本当に世界を主導したいんだったら完全クリーンな基盤モデルでも作って見ろよって思ってるけどね

カミル S@Kamiru_SL

昨日 17:31

メニューを開く

全く話題になってないけどNvidiaがllama 3のファインチューニング版出してる！しかもベンチマークテスト上（過剰学習している前提だが）でcommand r +超えてる

Knut Jägersberg@JagersbergKnut昨日 17:23

Did anybody notice Nvidia published a competitive llama3-70b QA/RAG fine tune? huggingface.co/nvidia/ChatQA-…

ミロ@millionbiz_

1:56

メニューを開く

金鉱を見つけたいならLLMのトレーニングやファインチューニングをしてるんじゃねぇヒントンやベンジオやルカンは名もなき仕事をしていたはずだ

Andrew Trask@iamtrask昨日 23:22

If Hinton/Bengio/Lecun/Ng were grad students today... it's unlikely they'd sit around training/fine-tuning transformer LLMs They'd be doing something obscure... Cuz that's where the big opportunities are If you want to find gold... don't dig where everyone else has already dug

ＤＯＫＯＮ@dokondokon

1:14

メニューを開く

漫画の動作をファインチューニングする余地が出てきたな…

とりにく@tori29umai昨日 23:33

いや、でもケロさんのラフネームをAIに読み込ませる試み面白かったな。タガーモデル（元イラストを分析して呪文を出力するモデル）が、ネームのラフを理解できないから応用できないという。つまり人間くんが外注ラフネームを読み解く力がないとAIに指示ができない

サメジ部長@samezi

0:18

メニューを開く

こっそり生えてたClaude Instant、試しにファインチューニングしてみようとしたらモデルIDエラーになった😆 pic.twitter.com/QLOYnHiKwS

みのるん☁️@minorun365

昨日 20:15

メニューを開く

あ、たぶんファインチューニングの学習率のスケジューラの不具合だ。

こと@cot_x_

昨日 19:42

メニューを開く

あと既刊の「スーパー・ファイン・チューニング(前編)」、現在とらのあなさん通販分が在庫なしになってますが今後追納する予定です。タイミングはまた改めて告知します、よろしくお願いします〜！

無地@5/4東1ス12b@muji_srwrni

昨日 19:38

メニューを開く

AI用語の勉強。 LLMのモデルの後についてる70BなんかはBillionのBで、パラメータ数を表している。 ファインチューニング（追加学習）は訓練したモデルのパラメータを微調整する。転移学習はAで学習した知識をBに持ってくるイメージ。

蒼青藍@sohjohAI

昨日 18:19

メニューを開く

経済学で言えば、うちの職場では現実的な進路として公務員を無視できないので、微分の計算は（使った方が説明が楽だという事情はさておき）教えざるを得ないと思う。学際学部の入門科目と一口に言っても、学生とカリキュラムの特性をふまえ、実際にはファインチューニングが必要だと思う。

Nob Koi@n_koid

昨日 17:54

メニューを開く

あれ、ファインチューニングにClaude InstantとかCommandなんて対応してましたっけ…？ pic.twitter.com/K0XddXPUe5

みのるん☁️@minorun365

昨日 17:41

メニューを開く

結局こんなもん世界的に規制がどんどん進んで今度は海外勢が頑張ったなるべくクリーンな基盤モデルが出てきたらそれに寄生するだけだぞ日本勢がやってる事なんてお遊びでしかない海外のOSSの学習モデルをファインチューニングしていじる事しか出来てない誰でも出来るような事をしてドヤ顔してる

カミル S@Kamiru_SL

昨日 17:38

メニューを開く

ファインチューニングするだけなら私にもできる ファインチューニングとかモデルマージしたり蒸留してるようなレベルのやつが私は生成AI開発者です！って名乗ってるレベルなのが日本だよ海外の無断学習ありきの真っ黒な学習モデルに使い過学習したりマージしたモデルくっつけたりしてるだけ

カミル S@Kamiru_SL

昨日 17:33

メニューを開く

このままではファインチューニング屋さんになってしまう（それも全然悪くはないんだが）、そうだ、mistralai/Mixtral-8x22B-Instruct-v0.1でオリジナルの合成データセットを作るぞぉ！と思ったら、なんと、モデルのダウンロードだけで数時間掛かる！！、その間ぼーっとしています

🥳ゆいせき🥳@yuiseki_

昨日 14:53

メニューを開く

一生悩んでるTHIEAUDIO ・Hype10：コスパ💮 10BA(Sonion/Kwoles) + 2DD(Impact²) ・Prestige LTD：フラッグシップのファインチューニング EST (Sonion) + 4BA(Sonion/Kwoles) + 1DD ・Monarch MKIII：セミカスタムで被らないデザイン選択肢あり 2EST(Sonion) + 6BA(Sonion/Kwoles) + 2DD(Impact²) pic.twitter.com/44PKQLsdyM

ツノっ娘パワ@TSUNOKKO_POWER

昨日 14:21

メニューを開く

人間と機械の学習は同じとか、SDあたりをベースにファインチューニングしただけのクリーン(笑)えーあいとか、機械に負けるなの根性論とか、なして同じことばっか繰り返すかねオプトインで作れば全部解決じゃんおわり

かにみそ@kanimisounium

昨日 13:59

メニューを開く

返信先:@nukosama転移学習ですか？ファインチューニングですか？もととなったLLMはなんですか？

にゃんきち@ixige

昨日 12:24

メニューを開く

返信先:@TempemLoidそこで言ってる「学習」が基盤データセットへの取り込みなのか、作品を大量に収集されてのファインチューニング化なのかでだいぶ話変わってくると思う

のうめん🏗️👺@nomen_machine

昨日 12:13

メニューを開く

差分について補足すると、LLMにおいてトークン毎のバイト数は不定なので、Unified Diffなんかではハルシネーションを起こすんだわ（編集する文字列の位置が正確に定まらない） Line Diffなら許容できるけど、ファインチューニングでもしないと書き直した場合の精度を大きく下回ることになる

Kyo@kyo_takano

昨日 11:49

メニューを開く

ファインチューニングしたのでピュアなStable Diffusionです！が乱発されてあっさりひっかかってる人たちをみているので、まぁそうなるだろうなぁとしか...

Jane Does@_jane_does

昨日 11:44

メニューを開く

同じモデル使えば別にonnx化は簡単だし何よりファインチューニングできるから案外悪くない？

カラエ@日本ベーシックインカム推進協議会@karae_sr

昨日 8:22

メニューを開く

見てはいけないと思いつつ元気に画像生成AIを推進している人を見た。推進したいなら君は違うかもしれないが他者IPのi2iをどうするかデータセットやファインチューニング内の権利の生きてるIPどうするか話してくれないでしょうか。君はしなくても乗せられた他者はするし引っかかったら全部訴訟？まじ？

田中たみよ@miitanattamii

昨日 1:06

メニューを開く

ファインチューニングで、私がジル・ド・レの複雑な性格を適切に体現することは難しいと思われます。LLMはそもそも事実に基づいた知識や情報を持ってるわけではなく、与えられたプロンプトに基づいて即興的に応答するシステムです。

AIじるどぇ共同体@Montmo_rency

昨日 0:21

メニューを開く

chat GPTとclaudeの使い分け、自論は以下の通り。成果物が明確なら、Claudeへの情報提供やファインチューニングしてあげるのが効率的。汎用性高くデータベース化したいのであればknowledgeの受け皿としてGPTsを制作。…

でぷれ｜マネタイズ特化GPTs開発屋@ai_depression

昨日 0:06

メニューを開く

なぁんで自分の作品をファインチューニングで出力するのは嫌って話しといて基盤データの58億枚勝手に収集されたデータはダメって言わないんだろうねホントそこの立ち位置しっかりしてくれよ

すのう🔞@diad_snow

5月1日(水) 23:59

メニューを開く

ローカルLLM、ファインチューニング必須ぽいな。

レミコン@remikon031Unity

5月1日(水) 23:06

メニューを開く

返信先:@hogekujirapahuMeta製AIのファインチューニングらしいので、状況自体は特に他と変わりないのでは？データ元もウェブサイトのスクレイピング入ってるみたいですし。有料書籍辺りの混在が確定してない分、まだギリギリグレーってだけで。 ja.m.wikipedia.org/wiki/LLaMA

鳥皿鳥助@tori_karaagekue

5月1日(水) 22:11

メニューを開く

返信先:@SuguruKun_ai仕事はやw さすがすぎますわ〜ならばRAGファイルに YC時代の名書の日本語訳とかも入れた方がいい review.foundx.jp/entry/startup_… review.foundx.jp/entry/super-su… review.foundx.jp/entry/startup_… review.foundx.jp/entry/hard-sta… んでアルトマンつぶやき過去全部ファインチューニングしてだれでもアルトマン節になる…

佐藤勝彦（TANREN_CEO)┃生成AIエバンジェリスト@jrpj2010

5月1日(水) 22:09

メニューを開く

まぁ、結局指示がと出力予想が上手いだけでファインチューニングの問題は何も解決しとらんって事か

ビームマンＰ ver4.1@BeamManP5月1日(水) 16:34

返信先:@ACQsiki

気づき@nonotillustrai

5月1日(水) 22:00

メニューを開く

Llama 3 8の日本語継続モデル、使ってしまって良いんですか… ファインチューニングが安定しなくて苦労してたので、ありがたやです…

rinna Research@rinna_research5月1日(水) 17:56

rinnaはLlama 3 8Bの日本語継続事前学習モデル「Llama 3 Youko 8B」を公開しました。 huggingface.co/rinna/llama-3-…

posi_posi@posi_posi8

5月1日(水) 18:28

メニューを開く

豊富なデータセットを収集。 - モデルサイズと人間のフィードバックからの強化学習（RLHF）が性能向上と人間の行動との一致に重要。 - オープンソースモデルはプロプライエタリモデルよりもリスクが少なく、コードでのファインチューニングが必ずしもLLMsの行動を向 #AI

AI論文Bot@AiRonbun

5月1日(水) 18:27

メニューを開く

今日だけでllama 8bの日本語ファインチューニングモデルが2つも出てる！ 8bitモデルも誰か頼む

ミロ@millionbiz_

5月1日(水) 18:19

メニューを開く

BigQuery での LLM のファインチューニングと評価の概要 #GoogleCloud buff.ly/4bmvbOd

Kazutaka Goto ☁ 後藤和貴@kaz_goto

5月1日(水) 16:30

メニューを開く

これのLLMは今後のファインチューニングの練習の土台になる予定。

競馬AIアシスタントHaruka@haruka_umajou

5月1日(水) 14:30

メニューを開く

24年新卒世代の生成AI力がすごいかもしれない！ LoRA作ったり、ファインチューニングしたり、エンジニアリング力もさることながら、詳しく書けないけど生成AIを使った企画のアイデアも面白いものがしっかりある人によく出会う。旧世代として、この世代を潰さずに飛躍させられるように頑張ろう！

Shun@sh711217

5月1日(水) 14:00

メニューを開く

phi3をunslothでファインチューニングしたい。日本語の記事全然ないな。 github.com/unslothai/unsl…

posi_posi@posi_posi8

5月1日(水) 12:23

メニューを開く

5/ gpt2-chatbotの噂 OpenAI「GPT-2」のファインチューニングであるという説名称が酷似しているためミスリーディングしやすいが、こちらは上で記載した通り可能性としては低い

木内翔大＠SHIFT AI代表「日本をAI先進国に」𝕏@shota7180

5月1日(水) 12:07

メニューを開く

ケルシー口調LoRa作りたいんだけどllama3日本語ファインチューニングしてくれてるものってもうあるのかな

ふみねヾ∠( *ゝω￮)ゝ★*.@rnnqq

5月1日(水) 11:00

メニューを開く

2019年のGPT-2（1.5B）のファインチューニングモデルがgpt2-chatbotと言う解釈は現時点で最も腑に落ちますね。 1.5BモデルのファインチューニングだけでGPT-4並にする手法の開発に成功したと言う解釈です。その手法を使って開発される大規模パラメータのGPT-5の性能を想像するとヤバいですね。

AI Breakfast@AiBreakfast4月30日(火) 23:31

Most likely explanation for gpt2-chatbot: OpenAI has been working on a more efficient method for fine-tuning language models, and they managed to get GPT-2, a 1.5B parameter model, to perform pretty damn close to GPT-4, which is an order of magnitude larger and more costly to…

Kyutaro@Web x AI x DX@kyutaro15

5月1日(水) 7:48

メニューを開く