データ利活用分野は素人なので当初は一般参加枠で参加登録していましたが、LT 枠の参加者が「7/8」で止まっているのを見て LT 枠に移動して参加しました。
LT 枠参加…で登録したものの
そういえば #jawsug_nagoya の5/9データ利活用回↓のLT、どんなテーマで申し込んだのかすっかり忘れてしまって困っているhttps://t.co/dWlPhw71xX
— hmatsu47(まつ) (@hmatsu47) 2025年4月26日
まずい。
ここ↓に呟きが残ってたhttps://t.co/IcfLh4hmsV
— hmatsu47(まつ) (@hmatsu47) 2025年4月26日
(ただ具体的に「HeatWave on AWS」の何の話だったかを思い出せない)
なるほど…でもまだはっきりしてない。
というわけで、先日の発表の内容をベースにネタを資料を作り始めて、なんとか形にしました。
(その後 connpass にタイトルが発表されたので、それに合わせて軌道修正)
そして当日
今日です。まだ補欠だけど。。。空くはず!//JAWS-UG 名古屋 5月会①「データ利活用研究会」 https://t.co/OIAP21bg2v #jawsug_nagoya
— ノリノリたかのり (@nori2takanori) 2025年5月9日
LT 枠に移動しておいてよかった!
開始!
#jawsug_nagoya 会場に来てる
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
(会社から30秒だけど今日は通院日だったので一旦家の近くまで戻ってから再び来た)#jawsug
データ分析業務じゃないけどテストデータ生成には困ってる🙋♂️#jawsug_nagoya#jawsug pic.twitter.com/3tBO5wpJb8
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
「プラガバ」と言われると「プラガブルな何かかな?」と思ってしまいますがプライバシーガバナンスですね。
学習させたモデルでテストデータを生成#jawsug_nagoya#jawsug pic.twitter.com/ON7Xe1ueHn
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
SageMaker でテストデータ生成用のモデルを作って、そのモデルでテストデータを生成!
動画でデモ#jawsug_nagoya#jawsug pic.twitter.com/lKWziobkg1
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
その場でデモをすると失敗する法則があるので動画に事前収録しておいて正解!
2番手はemiさん
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
今日は遠方の方がちらほらいらっしゃる#jawsug_nagoya#jawsug pic.twitter.com/IF11IxBRz3
この後も遠方勢の登壇者が多かったですね。
最初から壁が#jawsug_nagoya#jawsug pic.twitter.com/fqpzuOkOay
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
データの分析にしろ連携にしろ「繋ぎ方」は鬼門になりがちですね。
カラムが一部行方不明?#jawsug_nagoya#jawsug pic.twitter.com/HBTYhoUHME
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
推論だとどうしても取りこぼしというか確定できなくて除外してしまう列が発生するようです。
集計系は確かにうっかり実行するとフルスキャンしそうに思える#jawsug_nagoya#jawsug pic.twitter.com/Vnma0yJ51z
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
気になる点。
集計して分析する以上集計範囲のデータが全てスキャンの対象になるのは仕方ないとして、必要範囲外のレコードがスキャン対象になったり同じレコードが何度もスキャンされたりするのは避けたいところ。
次は角田さん
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
セキュリティ状況の可視化に使いたいのはわかる#jawsug_nagoya#jawsug pic.twitter.com/a2rcXTDd7b
スコアリングの基準を変えたいときとかもカスタマイズしたダッシュボードが欲しくなるかも#jawsug_nagoya#jawsug pic.twitter.com/R3MTdcU3Bk
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
Security Hub の「見せ方」に不満があるのわかる。
AWSブログのとおりに作れば簡単!…と思ってハマることはよくあるな…#jawsug_nagoya#jawsug pic.twitter.com/O5lSpjMRu2
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
内容が古くなって…というパターンもあるけど「最初から書いてある手順だけでは完成しない」パターンもありますね。
(今回は(最初は)問題なく完成した話)
最初は良かったんだけど…というのもよくある話#jawsug_nagoya#jawsug pic.twitter.com/jLXNDEocJ6
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
最初は良かったけどデータが増えたときに性能&料金問題が発生するの、データストアあるあるですね。
選択肢が複数あるのは良いけど一長一短あって選べないのもあるある#jawsug_nagoya#jawsug pic.twitter.com/n0V9rO1bKn
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
決め手がないのは辛い。
お次は山下さん
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
(LTの前に?)#jawsug_nagoya#jawsug pic.twitter.com/47IR5BFUoU
前フリ?
というわけで本題#jawsug_nagoya#jawsug pic.twitter.com/rBvEWY2SmW
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
普通はこんな感じ?#jawsug_nagoya#jawsug pic.twitter.com/FmaTEgxiJX
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
基本形態。
パーティショニングがないの、もしかしてこっそり課金を積み上げる戦略?(違#jawsug_nagoya#jawsug pic.twitter.com/BAgJXnm6wS
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
スキャン範囲が増える罠。
ただし時系列のパーティションは新しい期間のデータが増えるごとに新しいパーティションができる→都度 ALTER TABLE するのが面倒、ということでパーティション射影を使うと良いよ、という話でした。
さっきの話と一部繋がってる?#jawsug_nagoya#jawsug pic.twitter.com/DVUNcT3OAL
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
#jawsug_nagoya 休憩明け後半は山口さんから#jawsug pic.twitter.com/g43fFBVSCP
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
普段なかなか見ないテーマの話なのでみなさん興味津々です。
業種を考えるとインフルエンサー確かに大事#jawsug_nagoya#jawsug
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
…と言いつつ「実はインフルエンサーの勧めに従ってモノを買うことって少なくない?」という話が後の懇親会の場で出ていました。
これ(①)一般企業の社員の評価も似たような面があるな#jawsug_nagoya#jawsug pic.twitter.com/1DdY1rTAMk
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
「実務で出てくる問題点」っていう感じで興味深いです。
ブランドとのマッチ度を評価するのも大事#jawsug_nagoya#jawsug pic.twitter.com/3NuoJmFuth
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
このあたり、評価にベクトル(検索)を活用するのも面白そうかな?と思いました(懇親会でもそのあたりの話題を少しだけ)。
まとめ!#jawsug_nagoya#jawsug pic.twitter.com/Cb2UFxoqPs
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
宣伝!
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
東京で登壇されるとのこと!#jawsug_nagoya#jawsug pic.twitter.com/ySWjsxfHEu
勢いがすごい!
次は安田さん
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
みんな興味津々DuckDBの話!#jawsug_nagoya#jawsug pic.twitter.com/NTNqOsUun6
DuckDBとは?#jawsug_nagoya#jawsug pic.twitter.com/aE3vv621sS
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
これらの軸で組み合わせると、
「分析向けのSQLite」みたいな立ち位置#jawsug_nagoya#jawsug pic.twitter.com/mTOE4noGiH
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
SQLite は Cloudflare の D1 のような分散環境での使い方で注目を集めていますが、DuckDB はある程度小さめの容量のデータに対する分析を「隙間」みたいな場所で実行できるのでかなり話題になっていますね。
やってみた#jawsug_nagoya#jawsug pic.twitter.com/JKHEptb3m8
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
実験!
SQLを実行#jawsug_nagoya#jawsug pic.twitter.com/gEWFRmAnO4
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
結果が 0 件になるクエリを投げたのはご愛嬌(?)。
こちらもまとめ#jawsug_nagoya#jawsug pic.twitter.com/z2pNOBQZsT
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
そしてわたしのネタ、
JAWS-UG で扱って良いのかちょっと悩むネタですがそのまま突き進みました。
#jawsug_nagoya Oracle Cloud が AWS 上のリソースを使う……??
— emi (@shiranui_it) 2025年5月9日
HeatWave:OracleCloudのMySQLマネージドサービス
#jawsug_nagoya
— emi (@shiranui_it) 2025年5月9日
Auroraと比較
金額は半分くらい
列試行で圧縮されるので
Auroraの方はバッファプールにのりきらなくて遅かったのかも
性能比較に使ったのが「Aurora の半額くらいのインスタンス」ですね(それでも 10 倍以上は速くなる、という話)。
やはりどんなものでも「銀の弾丸はない」#jawsug_nagoya
— SUZUKI Masaki@クラウドエンジニア (@makky12) 2025年5月9日
です。
最後は川路さん#jawsug_nagoya#jawsug pic.twitter.com/gxBCDyg7kv
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
「短時間では説明しきれない」ということで、
ポイントはここらしい#jawsug_nagoya#jawsug pic.twitter.com/KmIep3Dn0b
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
ここだけ押さえといて、みたいなお話でした。
いいとこ取りした結果#jawsug_nagoya#jawsug pic.twitter.com/dHTKg9KiYv
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
「AWS はビルディングブロック」と言いながらも「ブロックの中に別のブロックを取り込む」みたいなことを繰り返した結果「デカくて複雑なブロック」ができあがることも…。
なるほどわからん(?)#jawsug_nagoya#jawsug pic.twitter.com/vyBKYYKfEs
— hmatsu47(まつ) (@hmatsu47) 2025年5月9日
懇親会
懇親会は当初参加する予定がなかったのですが、当日キャンセルで枠が空いてしまったとのことで最初の 1 時間ちょっとぐらい参加しました。
いやー、しばらく参加していないと顔ぶれが結構変わっていたりして浦島太郎化しますね。
昨日のMVPの山口さん#jawsug_nagoya pic.twitter.com/GiojMLkQEL
— Takaki (@frommiddle1) 2025年5月10日
残念ながらわたしはこの場面に立ち会う前に帰ってしまいました。
帰りはそこそこの強い雨でしたが、皆さん無事に帰り着けたでしょうか?
(わたしが家に帰った後、一段階雨の降り方が強まった気がします…翌朝、倒竹で名鉄の一部路線が止まってましたし)