自動更新

並べ替え:新着順

ベストポスト
メニューを開く

OpenAIのエンジニアが、アーキテクチャやパラメータ、オプティマイザーに関係なく、時間をかけて"学習"すればデータセットの中身そのものが出力されると今更言い始めたよ... おいおい... 最初っから圧縮・復元じゃないかとつっこまれてたろうに...

Carl Franzen@carlfranzen

"These models are truly approximating their datasets to an incredible degree" I've defended gen AI, but this stunning observation from OpenAI engineer James Betker (@neonbjb) would seem to bode poorly for the idea the tech doesn't infringe copyright on its training data.

Jane Does@_jane_does

メニューを開く

Youtubeに出てきたから見たけど、ドキュメント、サンプルデータセット、サンプルプロジェクトとか揃っているな。

🐼🐱🍺@hiuchida

メニューを開く

SFTで日本語データセットを学習させた後、そのモデルでさらにORPO使って学習させて、会話能力をChatVectorで与えたいけど、うまくいけばいいなぁ

メニューを開く

商用不可とのことですが、 センター試験のXMLという凄いデータセットをたまたま見つけました。 有名な東京ロボプロジェクト。 21robot.org/dataset.html GPTとか出る前に、「第三次AIブームを総括」した感のある本で、一読の価値があります。

畠山 歓 Kan Hatakeyama@kanhatakeyama

メニューを開く

>ここ20年近く、「海賊版の音楽はNG」「WinnyのゲームDLで業界が貧乏になる」「動画 共有サイトの違法動画は視聴 NG」「漫画村の漫画を読むと漫画家が生活出来なくなる」と いう風潮で過ごしてきた日本ですが、ここで突然「AIのデータセットが海賊版であっても、… pic.twitter.com/9i7rqL0Dih

北海のタコ@ogawa0117

メニューを開く

>個人の顔写真のAI学習を認めることは肖像権の侵害、暴力的描写、児童ポルノ等への使用 を許可することになり危険かと思います。 そもそも人間の顔データのデータセットって見たことがある? 頭から顔の輪郭がごっそり取られたのっぺらぼうのものと、顔のパーツの配置のみのデータセットしかないから。… pic.twitter.com/ZjmJYS06B3

北海のタコ@ogawa0117

メニューを開く

あたかもデータセットがガラス箱の中の機械のデモンストレーションを記述しているかのようです。 。まず片側が観客に向けられ、次に反対側が観客に向けられ、歯車が回転し、とんでもないことが起こるのが見えるかもしれない。

沙門@momoQ45

メニューを開く

MiCデータセットでの評価により、Text2Pic Swiftは、Recall@1000において最大11.06%の向上を達成し、トレーニングおよび検索時間をそれぞれ68.75%および99.79%削減している。 #AI

AI論文Bot@AiRonbun

メニューを開く

調教用のデータセットは一から自分で作らなくてもHugging Face探せば公開されてるのか...。感謝

Akira Miyauchi@akira_miyauchi

メニューを開く

データセットの内容が隠匿されてるので当該著作物の享受の内容は不明なので生成AIは合法!なんで普通に誰が聞いても屁理屈だと思うしその屁理屈がいつまでも強弁できる程無断学習生成AIって社会に利益をもたらしてますか?って話よな、  無断学習生成AIみたいな害悪犯罪ツールが滅ぼされるのは道理、

ケーエス@Ks42755279

メニューを開く

今の生成AI絡みの環境って無駄な争いばかり起きて生成AI推進派も規制派も得しない状態なんだからさ、データセットの内容を参照する事で享受の有無にしっかりケリつければ皆幸せに成れるじゃん?

ケーエス@Ks42755279

メニューを開く

前に絡んできた生成AI推進派が何か享受ガーって屁理屈捏ねてたけどやっぱり屁理屈じゃん、学習データセットの内容が隠匿されてるので享受の証明ができないから非享受で合法なんて屁理屈でしかないし、 そうやって有耶無耶のままは誰も得しないから第三者機関の監査による開示義務でFAじゃん?

ケーエス@Ks42755279

メニューを開く

BUMP OF CHICKENの新アルバム名を見てデータセット…?って少しでもチラついた人、正直に手を挙げなさい。はい。

メニューを開く

NPO法人の内容、認定団体のリストと定款が政府サイトに載ってるからデータセットの作成はかなり現実的だ、法人のウェブサイトに飛ぶ必要があるならしんどかった

メニューを開く

Applioで学習データセット読み込んだら音声ファイルの無音部分を削除してくれるの草 Audacityで自力で削除してたんだが?誰も教えてくれなかった…… なぜ俺はあんな無駄な時間を……

ぽちた@pochita_desu

メニューを開く

ていうか、ChatGPTのデータセットの話に画像の話で噛みついてるのも趣深いな...しかも大元はOpenAIのエンジニアの投稿なんだけど...(英語の引用画像だから読まんのか?)

Jane Does@_jane_does

メニューを開く

"Home Credit - Credit Risk Model Stability"のコードコンペに取り組むことにした🫡 しかし、データセットが26.77 GBもあって、Googleドライブの容量がすぐにいっぱいになりそうなので追加ストレージ(200GB)を課金する😅 pic.twitter.com/d9UVfuOknQ

ポム@データサイエンティストを目指す@Pom25257

メニューを開く

...2バイトで画像保存が最近のあっちの流行りなのか...?w (データセットは画像でもないし、容量以前に圧縮・復元の意味わかってるか...)

Jane Does@_jane_does

メニューを開く

返信先:@_jane_does圧縮・復元だというなら2バイトでイラスト1枚を保存できる技術を見つけてから言ってくださいね。 SDのデータセットが10GB、これに58億枚保存できるわけ無いだろ。

メニューを開く

「火焔猫燐データセット」を作りたい 数百行分のセリフを集めたもの

雷之電@touhou@lunaticlives

メニューを開く

返信先:@thunder_battery例えば、画像生成AIでしたらLAION-5Bのデータセット開示が一般的ですが、データセット開示だけではなく、具体的な画像を保管して開示する義務ができたのでしょうか? EUの法律は根幹が日本とは異なる考え方があり疎くてすみません。

メニューを開く

Meta社のLlama 3 8Bおよび70B FMが、バージニア北部とオレゴンのBedrockで利用できるようになりました! Llama 2と比べ7倍のトレーニングデータセット、4倍のコード量、2倍のコンテキストを含み、ユースケースに応じてパラメータ数の異なる2モデルを選択できます。 #しむそく aws.amazon.com/about-aws/what…

SimSta / しむすた@しまがじ!@shimagaji

メニューを開く

隔離空間のデータセットを使ってイチャコラしよう大作戦はまだ遠いの…(´・ω・`)外付けGPUてんこ盛りで1000Wぶっとばしかないんかのぉ…冬場使えるのはいいんだろうけどなやむのぉ…

yuki🌾㊗️9さい🎉⚔@yuki_obana

メニューを開く

スマホは本当にGenAIのゲーム氾濫してる。 ちなみに、今日steamでもイラストレーターの作品のみのデータセットを使用しています!と表示しているゲームがあった... 実写モデルマージだろうなあれは...

Jane Does@_jane_does

メニューを開く

KJ 氏の学習させようと思って買った P40 ですが、データセット作るの面倒くさすぎて浮いてます。

tomotomo9696​@tomotomo_9696

メニューを開く

というか汎用AIって どう作るのか と思ってたが 単に複数のデータセットを そのまま合体するだけ か それをすごいすごいって メディアと驚き家と議員に言わせる そんな予想

朽葉こど kutiba kodo@CodMonoProduct

メニューを開く

Iris←データセット

メニューを開く

今回の追加で,29編分の情報となったので,それなりにNDBオープンデータで何ができるかイメージが付くように思う。今後の方針としては,網羅的に追試しつつ,1年に1回,NDBオープンデータの更新のたびに,up-to-dateしたい。あわよくば,同じことをサンプリングデータセットでも進めたい。

奥村泰之@yachu93

「NDBオープンデータを活用した学術論文を基にした再集計」として論文18編分を,追加公開しました。 icer.tokyo/materials/ndb_…

奥村泰之@yachu93

メニューを開く

依拠性についてはAIの出力でも手描き二次創作でも「見てたらアウト」なんだよなぁ ただどうなるか気になるのは、データセットに含まれているので「データ上は依拠している」と言えそうだけど、利用者が「見たことがない作品」だったときよね 「見たことがない」場合は選別のしようがないだろうし

雷池@thunder_battery

生成AI推進派からするとt2iは「依拠性が無い為認められない」とか言っているが、パブリックコメントの結果見てないんだな…

ヤメエンジニート@YamEngiNeet

メニューを開く

各モデルについて話題にするとき、あなたはモデルではなく、データセットに言及しているのだ。 モデルのパフォーマンスは、データセットの概算に収束する。 と言うこの発言は、ビッグテックが伝家の宝刀にする『フェアユース理論』=『機能性の模倣であるから正当だ』と真っ向から対立するが、果たして

メニューを開く

やはりデータセットが全てやな

ishihara@KC59059057

メニューを開く

>RP これをやらせる前にデータセットの開示義務付けの法律は必要だとは思うのですが。自分も本当、ご本人たちの作品と承諾済の作品だけ食べさせてるなら全然やってくださいという気持ち。だって多分色々なものが混ざってるところに、自分たちのデータいれました!これは問題ないものです!くらいの→

小牧 央(コマキ=ヒサ)@Komaki_Hisa

メニューを開く

LLMを使った開発をしている人から1番聞きたかった話が書かれている。 LLMプロダクト開発における独自評価基準とデータセットの作り方の考察 zenn.dev/seya/articles/…

いっぬ@yuyu_hf

メニューを開く

返信先:@blinkjp_gameGO HubのポケモンGO バイオーム:完全ガイドはもう読まれましたか? 引用「バイオームは地球規模の生態系に関する USGS の公式データセットに基づいている」そうですよ?!世界には色んな地図があるものですね🧐 世界の陸生生態系がうんぬんかんぬん……だめ難しくて無理😇 usgs.gov/centers/geosci…

Pokémon GO Hub@PokemonGOHubNet

Trainers, our complete guide to Pokémon GO Biomes is here! See a complete list of Biomes, where the data is coming from, and what to expect form this feature moving forward! pokemongohub.net/post/guide/bio…

KOWLOONsGT@KOWLOONsGT

メニューを開く

仮にクリーンなデータセットで作った場合、いくら実写に近くても国内の児ポの定義には当たらないって逃げ道もあるにはあったんだろうけど。まあ今主流のエンジンやモデルはそうじゃないのでこの話はここでおしまいなんだよって感じ。

メニューを開く

絵柄の模倣は0から生み出してる場合のみ著作権には引っかからないけど、生成系AIはデータセット内の画像にラベリングして検索結果の複数の画像を混ぜてるので、二次加工に値するうえ、データセットから画像を引っ張ってくるソースコードになってるから依拠性が本来認められなければならないんだが、

霙はどちらかと言うと雪の仲間@akisame4901

メニューを開く

song おちゃめ機能 / LamazeP Alone / HAKASE K aka kimpaksa キャラクター原案/発音収録/管理者 litmus* @litmus_music 音声提供(RVCモデル製作用データセット提供) Myoya @myoya_v イラスト みたう @mztm_usgpic.twitter.com/b44osZrJ9Y

litmus* 春M3「お-22ab」@litmus_music

メニューを開く

「100%近似で出力される」のであって「時間をかけて"学習"すればデータセットの中身そのものが出力される」とも「圧縮・復元である」とも書かれてない 馬鹿は理解できるところだけをつまんで都合よく物語を生成するの典型

Jane Does@_jane_does

OpenAIのエンジニアが、アーキテクチャやパラメータ、オプティマイザーに関係なく、時間をかけて"学習"すればデータセットの中身そのものが出力されると今更言い始めたよ... おいおい... 最初っから圧縮・復元じゃないかとつっこまれてたろうに...

メニューを開く

CVSportsというコンピュータビジョンの国際会議CVPRのワークショップに3本の論文が採択されました! 1つ目はすでに筆頭のD2 @AtomJamesScott さんがお知らせしたように、サッカー、バスケ、ハンドボールの400万以上のBounding boxのついたデータセットを公開しています! atomscott.github.io/TeamTrack/

Keisuke Fujii (藤井慶輔)@keisuke_fj

メニューを開く

【HODACHI/Llama3-70B-ja】 Phi-3が出たのでどうしようか悩んでましたが、Llama-3-70Bの日本語再学習モデル続けてます。 ようやくデータセットのクリーニングが終わって、Eval用の日本語データも準備できたので、Trainかけてます。… pic.twitter.com/USfXPk3Tcj

ホーダチ | AI✖️Cloud✖️Dev | 外資×ひとり法人@hokazuya

メニューを開く

【HODACHI/Llama3-70B-ja】頑張って作ってます! Phi-3が出たのでどうしようか悩んでましたが、ようやくデータセットのクリーニングが終わって、Eval用の日本語データも準備できたので、Trainかけてます。… pic.twitter.com/FeBZypqJ6q

ホーダチ | AI✖️Cloud✖️Dev | 外資×ひとり法人@hokazuya

トレンド6:34更新

  1. 1

    エンタメ

    がらくた

    • ラストマイル
    • 米津さん
    • 米津玄師
    • 予告映像
    • 主題歌決定
  2. 2

    エンタメ

    アンナチュラル

    • メロンパン号
    • MIU404
  3. 3

    スポーツ

    フォーデン

    • デブライネ
    • アルバレス
    • ブライトン
    • ハーランド
    • ハットトリック
    • 2点目
  4. 4

    エンタメ

    坂本昌行

    • 三銃士
    • 末澤誠也
    • 広島公演
    • 末澤
    • Aぇ! group
  5. 5

    BELIEVE 日本バスケを諦めなかった男たち

  6. 6

    ITビジネス

    韓国負けた

    • 韓国負け
  7. 7

    アニメ・ゲーム

    洋画離れ

    • 子供の頃から
  8. 8

    スポーツ

    エイドリアン・ニューウェイ

    • ホーナー
    • ニューウェイ
    • レッドブル
  9. 9

    エンタメ

    アーティスト別

    • 300億円
    • Snow Man
    • 令和
  10. 10

    自民党全員落選運動

20位まで見る

電車遅延(在来線、私鉄、地下鉄)

遅延している路線はありません

全国の運行情報(Yahoo!路線情報)
よく使う路線を登録すると遅延情報をお知らせ Yahoo!リアルタイム検索アプリ
Yahoo!リアルタイム検索アプリ