- すべて
- 画像・動画
並べ替え:新着順
秋の夜長に、データ分析をどうぞ。(セルフサービスでいろんなことが出来ます。) IBM Cloud Pak for Data as a Service ハンズオン資料 目次 2021年8月作成 qiita.com/Shumpei_Kubo/i… #Qiita #Qiita10th #ibm #ibmcloud #前向きデータ整備人 #DataEngineeringStudy
#DataEngineeringStudy データはめちゃくちゃいろんな人が関わってるからこそ、どう社内に接点を作るのかって大事だよなぁ 関係地を作ることを諦めないっていい言葉だ 日本にCDO増えて欲しいなぁ
#DataEngineeringStudy GA technologiesの方、コミュニケーションを大切にしてるんだろうなぁとか、資料見やすいなぁとか、ここは話したら長くなっちゃうなぁとか、全体的に丁寧な方なんだろうなぁがすごい(小並感)
#DataEngineeringStudy あべさん、あついなー!!ありがたい〜! データ界隈でずっと戦ってきた人たちはみんな今までに関わってきた人たちに感謝を伝える文化がある感じがあってほんと良いなぁ
#DataEngineeringStudy ツイートでも書いてあるけど、ほんと祭りと泥臭さだよなぁ お客さん向けのアナリティクスサービス部分また別で詳しく聞きたい モテ期じわるけど、ほんと組織の中のポジショニングって大事だよな〜
#DataEngineeringStudy あー…誰が音頭を取るのか難しいよな… 率先して対応されたのすごい アクセスログを分析: 誰をヒアリングすべきかが分かる ヒアリング: 業務上の理由をヒアリングし、目的に遡る ヒアリングした結果KPIを見直し 結局各業務って地道な調整が一番大変だし、一番大事なんだよなぁ
#DataEngineeringStudy 1日に蓄積されるレコード数、2億ってゲームはやっぱりすごいな… Snowpipe docs.snowflake.com/en/user-guide/…
#DataEngineeringStudy DWHを選ぶ観点 - パフォーマンス →各社のベンチマーク記事読むよりも自社データで検証すべし - セキュリティ: 各ベンダーのHPに載ってるから見てね - バックアップ{&リカバリー) - スケーラビリティ - エコシステム - コスト: まずはSnowflakeとBigQueryで比較する
#DataEngineeringStudy DWHにも銀の弾丸はない(そりゃそうだ) 自分たちが計画しているデータ分析の要件を洗い出すことがいちばんだいじ 何事もゴール見失うと進めなくなるもんなぁ 従量課金なので自社のデータでトライアルしてみてどれくらいの費用感か試してみる RedShift割と見積もりしやすいんや
#DataEngineeringStudy 復活 DWHとは分析しやすいようにデータを蓄積するDB DWHの詳細は石川さんのYouTube見てね(これ1.3万回再生ってすごいな) youtu.be/G7weKwUE6KY?si…
#DataEngineeringStudy Snowflake社内でドッグフーディングしている(いい話) 実行プロファイルが見えるのが良い アカウント管理とかもこの画面からできる 多分今だとUIと関わってるだろうし、もっと良くなってんだろなー
#DataEngineeringStudy ParquetやORCと似ている? コンセプトは一緒だが、Snowflakeは使いやすいように独自のフォーマットを使ってる BQとRedShiftとの違いはクラウドのオブジェクトストレージが元にデザインされている、かな?
#DataEngineeringStudy シンプルさって最強だよなぁ シンプルにするのって難しいし もう一個は拡張性 どんな方向にでも進んでいけるアーキテクチャ トレードオフを取っている
#DataEngineeringStudy Time Travel: 最大90日間のデータが直感的に参照/復元できる Fail Safe: テーブルが完全に消えた後でも7日間はサポートは復元可 はわー、つえーなー 消しちゃわないことが一番大事なんだろうけど、触ってるのは人間だもんな
#DataEngineeringStudy Snowflakeはマイクロパーティションに最大値/最小値が入っているため値のレンジが分かるからこそ、テーブルスキャンの量を減らすことができる マイクロパーティションはオブジェクトストレージに格納されているため、イミュータブル(作成されてから変更できない)である
#DataEngineeringStudy SnowflakeはDWHだけじゃなくてData Cloudを目指してる SnowflakeはCloud Service、Multi-Cluster Compute、Centralized Storageの三層構造で出来ているがもっと深いところを話す回 マイクロパーティション: Snowflakeのテーブルの物理的な実体、それぞれメタデータを持ってる
#DataEngineeringStudy 有志だけでは限界が来た(そりゃそうだけど辛い) そこで業務請負の再定義を実施 これまで作ったものの価値最大化するために認知、UXの改善な動作を行った これは、ほんとチームが強いな…
#DataEngineeringStudy 有志のメンバーでコミュニティとしてデータ基盤運用してたのすげーな 議事録載せてくれてるのめちゃくちゃいいな、チームの雰囲気も見えて楽しそうだなぁてなるし 定例のレポートを展開して接触頻度増やして興味持ってもらうのつよいな!会社にコミュニティが文化としてありそう
#DataEngineeringStudy 何事も進める時、何故やるのかをメリットと一緒に伝えることって大事だよなぁ。 接触頻度を増やす、素直に聞くのが一番早い。間違いない… 何事も進め方が大事だよなぁ… すぐに儲かるものはあるのかwwwそんなんあったらみんなやってるしなぁwww
#DataEngineeringStudy DataOps~!! データ基盤の浸透はボトムアップだけだと限界がある、トップダウンも必要 ワークマンの本だ! ワークマンは 商品を変えずに売り方を変えただけで なぜ2倍売れたのか amzn.asia/d/0gfav2XE
#DataEngineeringStudy データ基盤が組織に浸透するには戦略とデータマネジメントが重要 戦略は診断、基本方針、行動に分けられる 定量・定性的なデータから今のデータ基盤の利用状況を調べ、すでに価値を最大化させているユースケースを特定し転用、最後はモデルで処理を共通化
#DataEngineeringStudy データ基盤が浸透する銀の弾丸はない 組織にデータ基盤の浸透した状態の例: 天気予報(わかりやすい) 組織内のどの程度の人たちが活用できている状態を目指すのかをチーム内で話すことが重要 業務上サイクルに組み込まれていたらデータを活用されてる
#DataEngineeringStudy 俺の考える最強のデータ基盤が現場のニーズに合ってない(つらい) ほんとデータ活用って文化形成周りにも関わってくるよなぁ ドキュメントの整備〜!!ほんと何事も結局ドキュメントだよなぁ〜!