ポスト

東工大のグループが、最大規模の日本語言語データセットを開発。Common Crawlから抽出・クリーニングした日本語テキストで、規模は文字数でCC-100データセットの10倍以上。 Building a Large Japanese Web Corpus for Large Language Models arxiv.org/pdf/2404.17733

メニューを開く

野田光明@Mitsuaki_Noda

4月30日(火) 23:03

人気ポスト

正直こっから記憶なく無い？？？？？

空腹の限界。 1500円もある！！ラーメン屋で豪遊するで！！と思ったのに券売機から500円玉全部返ってきた。新硬貨以外の所持金0。

今日泊まるホテル、従業員に異常猿愛者がいるっぽい

修学旅行で東京に行ってる息子、サイゼリヤに出会う。

ディズニーストアリゾート店の「特に理由は無いけどなんかこの並びにしたいと思ってェ…特に理由は無いです。何にも無いです。」のコーナー大好き。

この度、要介護4を卒業し5の認定を受けました。僕の実感とはやや違うと思いましたが、より手厚い介護を受けられるということ。有り難いことです。より質の高い原稿執筆、 SNSの発信を心がけていきます。全国の要介護5の皆さん、心豊かに頑張りましょう。

風強すぎてこれ

300円の指輪渡してるの意味わからんくて草

これマジで良い経験だった。改めて、１ヶ月弱雄信内駅で寝泊まりしてたのおもろいなー。

パーツ頼む時に立体がいいですか？って言われたから少し厚み出る感じかな…？と思ってはい！って返事したら想像を超えるしっかり立体で大笑いしてしまったこの寝顔必ず守る

もっと見る

トレンド23:51更新

20位まで見る

電車遅延（在来線、私鉄、地下鉄）

北海道東北関東中部近畿中国四国九州

全国の運行情報（Yahoo!路線情報）

よく使う路線を登録すると遅延情報をお知らせ　Yahoo!リアルタイム検索アプリ

Yahoo!リアルタイム検索アプリ