ポスト

RP元の返信欄に記載がありましたが、小説家になろう、カクヨム、pixiv小説を収集したデータセットはすでにあるそうです…

メニューを開く
Aratako@Aratako_LM

ハーメルンという小説投稿サイト(syosetu.org)から収集した192万4940件、102億4893万3456文字の小説データセットを作成し、公開しました。 学習に利用しやすいように様々なメタ情報を付与しています。 LLMの事前学習など機械学習向けにご利用ください。 huggingface.co/datasets/Arata…

ペンギン@penpengin2023

みんなのコメント

人気ポスト

もっと見る
Yahoo!リアルタイム検索アプリ