すべて
画像・動画

自動更新

並べ替え：新着順

ベストポスト

メニューを開く

OpenAIのエンジニアが、アーキテクチャやパラメータ、オプティマイザーに関係なく、時間をかけて"学習"すればデータセットの中身そのものが出力されると今更言い始めたよ... おいおい... 最初っから圧縮・復元じゃないかとつっこまれてたろうに...

Carl Franzen@carlfranzen昨日 1:36

"These models are truly approximating their datasets to an incredible degree" I've defended gen AI, but this stunning observation from OpenAI engineer James Betker (@neonbjb) would seem to bode poorly for the idea the tech doesn't infringe copyright on its training data.

Jane Does@_jane_does

メニューを開く

Youtubeに出てきたから見たけど、ドキュメント、サンプルデータセット、サンプルプロジェクトとか揃っているな。

🐼🐱🍺@hiuchida

メニューを開く

SFTで日本語データセットを学習させた後、そのモデルでさらにORPO使って学習させて、会話能力をChatVectorで与えたいけど、うまくいけばいいなぁ

そら@firmament_VR

メニューを開く

商用不可とのことですが、センター試験のXMLという凄いデータセットをたまたま見つけました。有名な東京ロボプロジェクト。 21robot.org/dataset.html GPTとか出る前に、「第三次AIブームを総括」した感のある本で、一読の価値があります。

畠山　歓　Kan Hatakeyama@kanhatakeyama

メニューを開く

>ここ20年近く、「海賊版の音楽はNG」「WinnyのゲームDLで業界が貧乏になる」「動画共有サイトの違法動画は視聴 NG」「漫画村の漫画を読むと漫画家が生活出来なくなる」という風潮で過ごしてきた日本ですが、ここで突然「AIのデータセットが海賊版であっても、… pic.twitter.com/9i7rqL0Dih

北海のタコ@ogawa0117

メニューを開く

>個人の顔写真のAI学習を認めることは肖像権の侵害、暴力的描写、児童ポルノ等への使用を許可することになり危険かと思います。そもそも人間の顔データのデータセットって見たことがある？頭から顔の輪郭がごっそり取られたのっぺらぼうのものと、顔のパーツの配置のみのデータセットしかないから。… pic.twitter.com/ZjmJYS06B3

北海のタコ@ogawa0117

メニューを開く

あたかもデータセットがガラス箱の中の機械のデモンストレーションを記述しているかのようです。。まず片側が観客に向けられ、次に反対側が観客に向けられ、歯車が回転し、とんでもないことが起こるのが見えるかもしれない。

メニューを開く

MiCデータセットでの評価により、Text2Pic Swiftは、Recall@1000において最大11.06%の向上を達成し、トレーニングおよび検索時間をそれぞれ68.75%および99.79%削減している。 #AI

AI論文Bot@AiRonbun

メニューを開く

調教用のデータセットは一から自分で作らなくてもHugging Face探せば公開されてるのか...。感謝

Akira Miyauchi@akira_miyauchi

メニューを開く

データセットの内容が隠匿されてるので当該著作物の享受の内容は不明なので生成AIは合法！なんで普通に誰が聞いても屁理屈だと思うしその屁理屈がいつまでも強弁できる程無断学習生成AIって社会に利益をもたらしてますか？って話よな、　無断学習生成AIみたいな害悪犯罪ツールが滅ぼされるのは道理、

ケーエス@Ks42755279

メニューを開く

今の生成AI絡みの環境って無駄な争いばかり起きて生成AI推進派も規制派も得しない状態なんだからさ、データセットの内容を参照する事で享受の有無にしっかりケリつければ皆幸せに成れるじゃん？

ケーエス@Ks42755279

メニューを開く

前に絡んできた生成AI推進派が何か享受ガーって屁理屈捏ねてたけどやっぱり屁理屈じゃん、学習データセットの内容が隠匿されてるので享受の証明ができないから非享受で合法なんて屁理屈でしかないし、そうやって有耶無耶のままは誰も得しないから第三者機関の監査による開示義務でFAじゃん？

ケーエス@Ks42755279

メニューを開く

BUMP OF CHICKENの新アルバム名を見てデータセット…？って少しでもチラついた人、正直に手を挙げなさい。はい。

はやし@ohyeah_ah_han

メニューを開く

NPO法人の内容、認定団体のリストと定款が政府サイトに載ってるからデータセットの作成はかなり現実的だ、法人のウェブサイトに飛ぶ必要があるならしんどかった

ベア@beared_real

メニューを開く

Applioで学習データセット読み込んだら音声ファイルの無音部分を削除してくれるの草 Audacityで自力で削除してたんだが？誰も教えてくれなかった…… なぜ俺はあんな無駄な時間を……

ぽちた@pochita_desu

メニューを開く

ていうか、ChatGPTのデータセットの話に画像の話で噛みついてるのも趣深いな...しかも大元はOpenAIのエンジニアの投稿なんだけど...(英語の引用画像だから読まんのか？)

Jane Does@_jane_does

メニューを開く

"Home Credit - Credit Risk Model Stability"のコードコンペに取り組むことにした🫡 しかし、データセットが26.77 GBもあって、Googleドライブの容量がすぐにいっぱいになりそうなので追加ストレージ（200GB）を課金する😅 pic.twitter.com/d9UVfuOknQ

ポム@データサイエンティストを目指す@Pom25257

メニューを開く

...2バイトで画像保存が最近のあっちの流行りなのか...?w (データセットは画像でもないし、容量以前に圧縮・復元の意味わかってるか...)

Jane Does@_jane_does

メニューを開く

返信先:@_jane_does圧縮・復元だというなら2バイトでイラスト1枚を保存できる技術を見つけてから言ってくださいね。 SDのデータセットが10GB、これに５８億枚保存できるわけ無いだろ。

隆@FhASwlfcyV7el4C

メニューを開く

「火焔猫燐データセット」を作りたい数百行分のセリフを集めたもの

雷之電@touhou@lunaticlives

メニューを開く

返信先:@thunder_battery例えば、画像生成AIでしたらLAION-5Bのデータセット開示が一般的ですが、データセット開示だけではなく、具体的な画像を保管して開示する義務ができたのでしょうか？ EUの法律は根幹が日本とは異なる考え方があり疎くてすみません。

namazu@namazu_push

メニューを開く

Meta社のLlama 3 8Bおよび70B FMが、バージニア北部とオレゴンのBedrockで利用できるようになりました！ Llama 2と比べ7倍のトレーニングデータセット、4倍のコード量、2倍のコンテキストを含み、ユースケースに応じてパラメータ数の異なる2モデルを選択できます。 #しむそく aws.amazon.com/about-aws/what…

SimSta / しむすた@しまがじ！@shimagaji

メニューを開く

隔離空間のデータセットを使ってイチャコラしよう大作戦はまだ遠いの…(´・ω・｀)外付けGPUてんこ盛りで1000Wぶっとばしかないんかのぉ…冬場使えるのはいいんだろうけどなやむのぉ…

yuki🌾㊗️9さい🎉⚔@yuki_obana

メニューを開く

スマホは本当にGenAIのゲーム氾濫してる。ちなみに、今日steamでもイラストレーターの作品のみのデータセットを使用しています！と表示しているゲームがあった... 実写モデルマージだろうなあれは...

Jane Does@_jane_does

3
5

メニューを開く

KJ 氏の学習させようと思って買った P40 ですが、データセット作るの面倒くさすぎて浮いてます。

tomotomo9696@tomotomo_9696

メニューを開く

というか汎用AIってどう作るのか　と思ってたが単に複数のデータセットをそのまま合体するだけ　かそれをすごいすごいってメディアと驚き家と議員に言わせるそんな予想

朽葉こど kutiba kodo@CodMonoProduct

メニューを開く

Iris←データセット？

志摩@shima_in_jpn

メニューを開く

今回の追加で，29編分の情報となったので，それなりにNDBオープンデータで何ができるかイメージが付くように思う。今後の方針としては，網羅的に追試しつつ，1年に1回，NDBオープンデータの更新のたびに，up-to-dateしたい。あわよくば，同じことをサンプリングデータセットでも進めたい。

奥村泰之@yachu93昨日 16:15

「NDBオープンデータを活用した学術論文を基にした再集計」として論文18編分を，追加公開しました。 icer.tokyo/materials/ndb_…

奥村泰之@yachu93

3
4

メニューを開く

依拠性についてはAIの出力でも手描き二次創作でも「見てたらアウト」なんだよなぁただどうなるか気になるのは、データセットに含まれているので「データ上は依拠している」と言えそうだけど、利用者が「見たことがない作品」だったときよね「見たことがない」場合は選別のしようがないだろうし

雷池@thunder_battery4月24日(水) 21:28

生成AI推進派からするとt2iは「依拠性が無い為認められない」とか言っているが、パブリックコメントの結果見てないんだな…

ヤメエンジニート@YamEngiNeet

メニューを開く

各モデルについて話題にするとき、あなたはモデルではなく、データセットに言及しているのだ。モデルのパフォーマンスは、データセットの概算に収束する。と言うこの発言は、ビッグテックが伝家の宝刀にする『フェアユース理論』＝『機能性の模倣であるから正当だ』と真っ向から対立するが、果たして

ash-i@sora_hune

メニューを開く

やはりデータセットが全てやな

ishihara@KC59059057

メニューを開く

＞RP これをやらせる前にデータセットの開示義務付けの法律は必要だとは思うのですが。自分も本当、ご本人たちの作品と承諾済の作品だけ食べさせてるなら全然やってくださいという気持ち。だって多分色々なものが混ざってるところに、自分たちのデータいれました！これは問題ないものです！くらいの→

小牧央(ｺﾏｷ=ﾋｻ)@Komaki_Hisa

メニューを開く

LLMを使った開発をしている人から1番聞きたかった話が書かれている。 LLMプロダクト開発における独自評価基準とデータセットの作り方の考察 zenn.dev/seya/articles/…

いっぬ@yuyu_hf

メニューを開く

返信先:@blinkjp_gameGO HubのポケモンGO バイオーム：完全ガイドはもう読まれましたか？引用「バイオームは地球規模の生態系に関する USGS の公式データセットに基づいている」そうですよ？！世界には色んな地図があるものですね🧐 世界の陸生生態系がうんぬんかんぬん……だめ難しくて無理😇 usgs.gov/centers/geosci…

Pokémon GO Hub@PokemonGOHubNet4月23日(火) 4:00

Trainers, our complete guide to Pokémon GO Biomes is here! See a complete list of Biomes, where the data is coming from, and what to expect form this feature moving forward! pokemongohub.net/post/guide/bio…

KOWLOONsGT@KOWLOONsGT

メニューを開く

仮にクリーンなデータセットで作った場合、いくら実写に近くても国内の児ポの定義には当たらないって逃げ道もあるにはあったんだろうけど。まあ今主流のエンジンやモデルはそうじゃないのでこの話はここでおしまいなんだよって感じ。

メニューを開く

絵柄の模倣は0から生み出してる場合のみ著作権には引っかからないけど、生成系AIはデータセット内の画像にラベリングして検索結果の複数の画像を混ぜてるので、二次加工に値するうえ、データセットから画像を引っ張ってくるソースコードになってるから依拠性が本来認められなければならないんだが、

霙はどちらかと言うと雪の仲間@akisame4901

メニューを開く

song おちゃめ機能 / LamazeP Alone / HAKASE K aka kimpaksa キャラクター原案/発音収録/管理者 litmus* @litmus_music 音声提供(RVCモデル製作用データセット提供) Myoya @myoya_v イラストみたう @mztm_usg… pic.twitter.com/b44osZrJ9Y

litmus* 春M3「お-22ab」@litmus_music

2
8

メニューを開く

「100%近似で出力される」のであって「時間をかけて"学習"すればデータセットの中身そのものが出力される」とも「圧縮・復元である」とも書かれてない馬鹿は理解できるところだけをつまんで都合よく物語を生成するの典型

Jane Does@_jane_does昨日 8:38

OpenAIのエンジニアが、アーキテクチャやパラメータ、オプティマイザーに関係なく、時間をかけて"学習"すればデータセットの中身そのものが出力されると今更言い始めたよ... おいおい... 最初っから圧縮・復元じゃないかとつっこまれてたろうに...

Nyuks@nyuks_deity

メニューを開く

CVSportsというコンピュータビジョンの国際会議CVPRのワークショップに3本の論文が採択されました！ 1つ目はすでに筆頭のD2 @AtomJamesScott さんがお知らせしたように、サッカー、バスケ、ハンドボールの400万以上のBounding boxのついたデータセットを公開しています！ atomscott.github.io/TeamTrack/

Keisuke Fujii (藤井慶輔)@keisuke_fj

メニューを開く

【HODACHI/Llama3-70B-ja】 Phi-3が出たのでどうしようか悩んでましたが、Llama-3-70Bの日本語再学習モデル続けてます。ようやくデータセットのクリーニングが終わって、Eval用の日本語データも準備できたので、Trainかけてます。… pic.twitter.com/USfXPk3Tcj

ホーダチ | AI✖️Cloud✖️Dev | 外資×ひとり法人@hokazuya

14

メニューを開く

【HODACHI/Llama3-70B-ja】頑張って作ってます！ Phi-3が出たのでどうしようか悩んでましたが、ようやくデータセットのクリーニングが終わって、Eval用の日本語データも準備できたので、Trainかけてます。… pic.twitter.com/FeBZypqJ6q

ホーダチ | AI✖️Cloud✖️Dev | 外資×ひとり法人@hokazuya

もっと見る

トレンド6:34更新

20位まで見る

人気ポスト

日本人は心に刻め

ずっと楽しみにしてた等身大ヤドンぬいぐるみ届いた🥳✨✨

サッカーで飛び蹴りは無しですっ☆ちぃたん☆ですっ☆ LOVE football⚽️

昨日のnews zeroみて目を疑ったのは僕だけじゃないはず📶

ナニコレ？と思ったけど、もしかして？と調べたらやはりそうでした（続）

最近激増中のコイツ、イライラ感ヤバくね？

初めて旅先で発熱したのだけど、ホテルが優しくて冷えピタ買ってきてくれた…☺️

インフルで暇すぎて10回くらい抜いたら、体温下がってきて今これ

術後ハイだから載せるけど見て〜！

【撃退】空手経験者の男性がクマを蹴る、現れたクマ2頭は逃走北海道 news.livedoor.com/article/detail… 男性が向かってきたクマの顔面を右足で前蹴りしたところ、クマはその場から逃げたという。警察によると、男性は前蹴りした際に右足をひねり、足の甲の痛みを訴えている。

電車遅延（在来線、私鉄、地下鉄）

北海道東北関東中部近畿中国四国九州

遅延している路線はありません

全国の運行情報（Yahoo!路線情報）

よく使う路線を登録すると遅延情報をお知らせ　Yahoo!リアルタイム検索アプリ

Yahoo!リアルタイム検索アプリ