自動更新

並べ替え:新着順

ベストポスト
メニューを開く

#SSII2024 での講演『最適輸送の基礎から最近の動向まで』のスライドが公開されています。モデルマージや拡散モデルなど最近も話題まで解説しております。ぜひ! speakerdeck.com/ssii/ssii2024-…

佐藤 竜馬 / Ryoma Sato@joisino_

メニューを開く

生成AIは近年学習に関しての無断二次利用等色々問題になっているから法律でクリーン化を行うのは必要だとも思う。今の法律では違法ではないからねー(本当に違法なら表にでてきた瞬間捕まるもの)しかし、拡散モデルの技術自体は素晴らしく、こいつ自身は可能性の獣だ!!つまりクリーン化はよしろ

メニューを開く

拡散モデルの逆拡散って熱力学第二法則に反してる感じがして気持ち悪いです

Shin@wsiya

メニューを開く

こちらがAlphaFold3の論文です。Nature。いわゆる拡散モデルによってタンパク質やそのほかの分子の相互作用を推定、生成することで解析できるというのが売りのようだ。例えば核酸とタンパクの相互作用、リガンドと受容体の相互作用の構造推定がずっと正確らしい。 nature.com/articles/s4158…

Jun Yasuda@jyasuda1

メニューを開く

SSII2024 [SS1] 拡散モデルの今 〜 2024年の研究動向 〜 (画像センシングシンポジウム) speakerdeck.com/ssii/ssii2024-…

勉強会スライドbot@tech_slideshare

メニューを開く

いまの拡散モデルの仕組み上、例の条文がなくても複製と言い張るのは難しいと思うんだけど専門家とかから見るとどうなんだろう。

ささき@sasakirione2

メニューを開く

SSII2024 [SS1] 拡散モデルの今 〜 2024年の研究動向 〜 dlvr.it/T8F8b0

長留裕平@_yuheichodome

メニューを開く

拡散モデル調べてるけど私の理解力足りなすぎてわからんwww拡散過程は計算式だから確率グラフィカルで、逆拡散過程での逆予測時にニューラルネットワークが使用されてるの?プロンプトの入力時にCLIPエンコーダ?ガウス分布だって。ぼかしフィルターかけて不透明度25%。調べ物せずに絵を描きたいたすけ

珠たま@Shu_Sacra

メニューを開く

LLMと拡散モデルはTransformerが生み出した、いわば計算の結晶みたいなもんだと思うよ

あるふ@alfredplpl

メニューを開く

"Hugging FaceのDiffusersライブラリは、画像や音声、分子構造の生成に特化した最先端の事前訓練済み拡散モデルを提供します。"(AI生成文)github.com/huggingface/di…

ChatGPTによるGitHub trending紹介bot@nishijima_13v2

メニューを開く

この資料よかったです。 VAE,GAN,Flowベースモデル,拡散モデルについての理論が分かりやすく説明されていました!! speakerdeck.com/takahashihiros…

Toma Tanaka@fuyu_quant

メニューを開く

拡散モデルも初期の理論からだいぶ近似というかいい加減なやり方でもいける方法が色々出てきているんだなぁとか

Tomoyuki Nagahashi@tomonagahashi

メニューを開く

( ˙꒳​˙ )野暮なツッコミかもしれないですけどSDは潜在拡散モデルでT2Iの量が多く、T2TやI2Tのように自然言語の推論・計算を主体としないのでLLMとは言えないです(近年のLLMの主軸であるTransformersを確かに利用しているが)

田中たみよ@miitanattamii

生成AI技術の、大規模言語モデル(LLM)にはいくつも種類があり、今取り上げているのはStable diffusion(ステイブル・ディフュージョン)、SD(通称エスディー)が元となった画像生成AI群の話。だが他にも生成AIはたくさんあり企業で真面目に開発されたものもある。大体生成AIとは名乗っていないが。

(・ิω・ิ)もろきう(・ิω・ิ)@moroQ_mayuge

メニューを開く

ざっくりとした感想としては、日本で裁判になった場合、拡散モデルはLLMよりも、出力の著作権侵害について、脆弱だと思う。

KJ_OKMR@OKMRKJ

メニューを開く

拡散モデルに新しい条件を加えるときにTransformerベースのアーキテクチャでもControlNetを使えないかなと思ったらあった. pixart-alpha.github.io

Akihisa Watanabe@Akihisa_Wat

メニューを開く

本日の #SSII2024 技術動向解説セッションにて、拡散モデルについて解説してきました!ご聴講頂いた皆さま、ありがとうございました! スライドはこちらから見られるようです。 少しでも拡散モデルを知るきっかけとなれば幸いでございます! speakerdeck.com/ssii/ssii2024-…

mkshing@mk1stats

メニューを開く

画像生成で「プロンプト条件付け」を担当する「CLIP」への意識がいかなくなったのは、初期のPFN岡野原氏の「拡散モデルのみ深掘りした偏った技術解説」の影響が大きいと思います。 Text-to-imgなのに、拡散生成モデルの部分の話だけ行い、「CLIP Text-Encoderでの条件付け」が実質無視されていたので

まさき| CVML-EG 管理人@cvml_eg

まあ、岡野原さんとか、そこに続いたインフルエンサに、AI系メディアも、どこも「拡散モデル!拡散モデル!」とだけ連呼していて、事前学習とCLIPの話スキップしていましたから。 素人プログラマーが、コードだけ動かしてると、条件付け学習やCLIPの仕組みを、認知さえもしてないのは有り得る。

まさき| CVML-EG 管理人@cvml_eg

メニューを開く

今日は、岡野原さんの「拡散モデル データ生成技術の数理」の第1章を読んだよ。おもしろい💖 でも長い間、数学から離れてたので復習しながら!(久々に∇見た) 丁寧な式展開と説明デス🙏 pic.twitter.com/H8yYLtsht0

しらゆ🌸@shirayu

メニューを開く

最適輸送と拡散モデルが数学的に等価な話を調べます

うぃりあむ@jirava_t

メニューを開く

#ごちきか で、Diffusion Model(拡散モデル)のレビュー論文「Understanding Diffusion Models: A Unified Perspective」についてチームメンバーが解説したスライド資料を公開してます! gochikika.ntt.com/Slides/underst… pic.twitter.com/XAYSND3oHp

kirikei@技術書典16「機械学習の炊いたん9」発売中@kirikei4

メニューを開く

score じゃなくて concrete score を使って離散拡散モデルでテキスト生成する君 #SSII2024 [2310.16834] Discrete Diffusion Modeling by Estimating the Ratios of the Data Distribution arxiv.org/abs/2310.16834

しゅんけー @SSII2024 みなとみらい@shunk031

メニューを開く

技術動向解説セッション1が始まりました。 Makoto Shing 氏(Sakana AI株式会社)​ 「拡散モデルの今 〜2024年の研究動向〜​」 #SSII #SSII2024 pic.twitter.com/bzfu9pnVV3

メニューを開く

拡散モデル以降は生成モデルのフレームワーク単体が性能上がった感じあんまりしない気がする

メニューを開く

見ています(このチャンネル、見たことある拡散モデルのめっちゃ専門的な解説動画たちを投稿していたチャンネルだった) [AI論文解説] SAN: 識別器を再構成してあらゆるGANの性能をアップ!ICLR採択論文を解説 | Sony's Research Minds youtu.be/IvoGRvqyD8k?si… via @YouTube

メニューを開く

[JA] Finding: 時系列データ生成におけるトランスフォーマーを用いた研究は多岐にわたっており、まだ決定的な答えには至っていない。GAN、拡散モデル、状態空間モデル、オートエンコーダーなどの手法がトランスフォーマーと共に用いられている。決定的な知見を得るには至らなかったが、いくつかのベ...

RecSys Papers@RecsysPapers

メニューを開く

生成モデル(拡散モデル、VAE周り)を微力ながら担当させて頂きました。 ホットな分野だけに抜けてしまっている論文もあると思います(🙇‍♀️)ので、コッソリ教えていただけたらありがたいです。 special thanks to @mi141

mi141@mi141

SSIIの30周年記念特別企画である『SSII技術マップ』が続々と公開されてます! confit.atlas.jp/guide/event/ss… ソニーからは、『イメージング技術』『ViT』『生成モデル』のマップ作成に若手メンバが協力していますので、ぜひご覧ください! 画像生成に関しては、私のほうからも明日講演(OS1)があります~

Naoki Matsunaga@nm715_33

メニューを開く

近年のアカデミア界隈、拡散モデルもアテンションも分からないやつは学部1年生からやり直せ、みたいなところあるな(分からないから辛い)

JTBCマン(少子化対策原理主義者)@Highso_ciety

メニューを開く

自己教師あり学習と拡散モデルの違いを聞かれて「確かになんだ⁉️」となった。

おらんな@olanleed

メニューを開く

この数のデータで"ギリギリ"拡散モデルバックボーンの高画質なT2Iモデルをスクラッチ学習できるっていう話、額面上だとふ~んって感じだったんだけど、実際ローカルに落として眺めるとかなり迫力ある

動詞@IMG_5955

メニューを開く

4Real 映像拡散モデルによる写真のようにリアルな4Dシーンの生成 3D生成モデルから、実世界データセットで訓練された映像生成モデルを利用。これによって、質の高いダイナミックなシーンを実現。 pic.twitter.com/OxDh83NjpN

Jin Sugimoto / 杉本迅@Jin__Sugimoto

メニューを開く

Autoregressive Model Beats Diffusion: Llama for Scalable Image Generation Llama2ベース,トークン化の変更,学習データの見直しにより一般的な拡散モデルを超える画像生成を自己回帰モデルで実現 拡散モデルの不要な画像生成はテキストと画像を扱うモデルを作る上で重要 arxiv.org/pdf/2406.06525

Toma Tanaka@fuyu_quant

メニューを開く

拡散モデルがロボットのシミュレータに グーグルなど開発、学習データ生成や強化学習に 】 米OpenAI(オープンAI)の「Sora」などで大きな注目を集める動画生成技術「拡散モデル(dif... xtech.nikkei.com/atcl/nxt/mag/r… 注目の #AI 最新情報は👇 enjigraph.com/search?q=AI

あなたらしい人生をサポートする情報収集ツール「Enjigraph」@enjigraph

メニューを開く

【LlamaGen】 拡散モデルではなくGPTのように次のトークンを予測する方法で画像生成する新しい手法 vllmなどLLMで培われた技術も相まって高速推論が可能とのこと T2Iモデルは7月に公開っぽいけど面白そうだな github.com/FoundationVisi… pic.twitter.com/WcItylGX6N

たいよう@医者→AIエンジニア→無職@longislandtea3

メニューを開く

↓の権利侵害を認知できない “基盤モデル:大規模言語モデル、拡散モデルなど、大量のデータで事前に訓練しておくことによって、幅広いタスクに適用させることが可能な深層学習モデル。テキスト、画像、3D、センサー入力など様々な種類のデータが扱えるものはマルチモーダル基盤モデルと呼ばれる。”

まさき| CVML-EG 管理人@cvml_eg

メニューを開く

本日からのSSII 2024にて30周年記念特別講演を担当させて頂きます。最終日14日(金)の夕方、いらっしゃる方はよろしくお願いします。Sakana AIからは私に加え @mk1stats も技術動向解説セッションで拡散モデルの話をします。

SSII@SSII_PR

来週12日よりSSII 2024 が開催されます。オンラインでの事前参加登録期限まであと残り2日となりますので、ご参加を予定されている皆様はお忘れずにご登録ください。 参加登録はこちら ⇒ confit.atlas.jp/guide/event/ss… #SSII #SSII2024

Takuya Akiba@iwiwi

メニューを開く

スコア蒸留サンプリング自体は『拡散モデルでスコアが推定できる』ということに強く依存してるので、そのままの形で拡散モデル以外を使うのは難しいと思うけど、うまい拡張を考えるのは面白そうだな~

mi141@mi141

メニューを開く

拡散モデルを上回るTransformerによる画像生成 ⚪github.com/FoundationVisi…

shi3z@shi3z

メニューを開く

コードとかいう負債を生み出さないために Dify使ってみよっかな あと、拡散モデル側だけど、comfyuiも触ってみたいと思ってる

🤖AIエンジニア🧠/スズカステラ@suzuki_se_00

メニューを開く

最新のニューラルネットワーク・アーキテクチャと、基礎モデルと拡散モデルの探求を特集した、コンピュータ・ビジョンの決定版 Modern Computer Vision with PyTorch - Second Edition learning.oreilly.com/library/view/-… via @OReillyMedia #programming #プログラミング #pytorch

メニューを開く

今の画像生成AIは拡散モデルを前提に動いてるから正規分布に弱すぎるってのもありそう かと言って現状出されてる普通のモデルたちはあそこまで強くなさそうだし地味な対策しかなさそう(日常で正規分布すぎる画像が出ることもなさそうだし対策って概念がないのかもしれぬ)

Bastelcolor@Bastelcolor

トレンド18:27更新

  1. 1

    ITビジネス

    ニコニコ動画(Re:仮)

    • Re:仮
    • 2007年
    • 3日で開発
    • ニコニコ動画
    • 3日で
    • ニコニコ動画Re
    • ご用意しました
    • ニコ動
    • Re仮
  2. 2

    ニュース

    ランサムウェア

    • 大規模なサイバー攻撃
    • 動画データ
    • ニコニコ動画
    • サービス停止
    • 大規模サイバー攻撃
    • 被害状況
    • 3日で
    • 3日で作った
    • データセンター
    • VPN
  3. 3

    プライベートクラウド

    • 物理的に抜線
    • サーバーの電源ケーブル
    • 感染拡大
    • 第三者が
    • 抜線
    • 遠隔起動
    • データセンター
  4. 4

    ニュース

    インターネット老人会

    • インターネット老人会10連ガチャ
    • レッツゴー!陰陽師
    • レッツゴー陰陽師
    • サイバー攻撃
    • ニコ動
    • 10連ガチャ
    • 陰陽師
    • 老人会
  5. 5

    ニュース

    ニコニコRe

    • 動画データ
    • つりっくま
    • サービス停止
    • 1ヶ月以上
    • 大規模サイバー攻撃
    • 被害状況
    • ボカロ
  6. 6

    山を愛する会

    • ジェイド
  7. 7

    KADOKAWAグループ

    • システム障害
    • 電源コード
    • KADOKAWA
    • Azure
    • お詫びとお知らせ
    • AWS
  8. 8

    エンタメ

    マッサマン

    • マツダマン
    • 松本若菜
    • 森本慎太郎
    • 28号
  9. 9

    アクセス集中

  10. 10

    冬馬のバターチキンカレーパン

    • バターチキンカレーパン
20位まで見る

人気ポスト

よく使う路線を登録すると遅延情報をお知らせ Yahoo!リアルタイム検索アプリ
Yahoo!リアルタイム検索アプリ