ポスト
Metaの基礎AI研究(FAIR)グループは、新しいオープンソースのAIモデルと技術の数々を公開しました。 オープンソースとは、誰でも自由に利用・改変・再配布できるソフトウェアのこと。 公開されたモデルや技術には、以下のようなものがあります。 1. マルチモーダル言語タスク:…
メニューを開くみんなのコメント
メニューを開く![](https://rts-pctr.c.yimg.jp/BgIFgYJGVIVv8u0nVJvw8B2FauAYMF4jOP5zFJAV4i5e72TLbER0xQeK1l8ZZ0OLvTAvdv60TJpCejvqfJhI_cLQDeTQo5OXcG4l_cxBnaqyhHpCsrfZ0YfXC7jyQuwymz2cwbDqGo0hQ20fsuox_HuNoy0QiLwAs510FoFe5LFbJG07CNxwuSRCmbFbhaukKGai8OgPVX0XCnW-9SkS6CYHyOuNdIAICJgTmbMlyjM=)
Google DeepMindは、ビデオから音声を生成する「ビデオ・トゥ・オーディオ(V2A)」システムに関する新しい研究を発表しました。 このシステムは、AIを使って動画に詳細で同期の取れたサウンドトラックを生成することを可能にします。…