発表枠では第 31 回のオンライン開催以来の参加となりました。
いきなり反省から
第 31 回の発表のときも「話にメリハリがなかった」と反省していたのですが、今回は最終的に 20 分になるのか 30 分になるのかはっきりわからないまま、というか自分自身で決めないまま進めてしまったので、結果的に当日途中から説明をかなり端折ってしまい理解しづらい話になってしまいました。
20 分枠で喋るのであれば、できあがったデータの構造に着目するよりも「今回はこのような目的で非定型データ(文章)からグラフ構造を作ったけれど、別の目的、例えば◯◯であれば△△という Extractor を使えば□□をグラフ構造に落とし込んで定型データをグラフ構造に落とし込んで精度の高いコンテキストの取得ができる」という話に展開したほうが良かったもしれません。
もっとも、直前の週は大吉祥寺.pm 2025 へのスタッフ参加、そして 8 月下旬には「もしかしたら JAWS FESTA 2025 で Aurora DSQL の話をするかも?」と思ってクラウド LT 大会 vol.14 フリーテーマ!での関連発表(前フリというか FESTA で話す予定の内容の一部分を深掘りしたもの)の仕込みをしていたので、準備時間が足りなくなって結局 6 月に話した内容をほぼなぞる形になってしまいました。
(そして JAWS FESTA 2025 ではプロポーザルが通って本当に Aurora DSQL の話をすることになったので、同じ失敗を繰り返さないよう、準備を早めに進めます)
話は変わって…当日午前中
このところ天候が不安定で、前週の大吉祥寺.pm 2025 へのスタッフ参加のときも東京まで通常 2 時間弱のところ 5 時間掛かってしまったので、早めに岡山に着くよう新幹線で向かいました。
3 連休の初日だったこともあり名古屋から新大阪まで少し遅れ気味で進みましたが、新大阪以西はほぼ定刻通りで移動できました。
そのため、空いた時間で岡山シティミュージアムに立ち寄りました。
まずはこちらへ pic.twitter.com/4gwGVIrNzg
— hmatsu47(まつ) (@hmatsu47) 2025年9月13日
まず入口側にある無料の岡山空襲展示室から見学。
空襲で市街地の 6 割が焼き尽くされた後、戦後はすごい勢いで住宅地や商業地域が復興していった様子を写真パネルで見ることができました。
続いて有料エリアへ。
常設展でしたが初めて来たのでゆっくり見学することができました。
(桃太郎伝説ゆかりの地として、地元愛知の犬山市も紹介されていました。犬山の桃太郎神社にはシュールな像などいろいろ置いてあって B 級スポット感満載なので、そういうのが好きな方は、老朽化で撤去される前に行ってみると良いかと…)
そして一旦駅に戻ってお土産を調達した後、適当な時間になったところで会場入りしました。
#ChugokuDB 会場着
— hmatsu47(まつ) (@hmatsu47) 2025年9月13日
さっきシティミュージアムでもらった缶バッジ🍑とともに🐬 pic.twitter.com/nR7X31bzrO
DB 勉強会本編
前半 2 セッション(1 セッション+1LT?)は日本オラクル山﨑さんから。
諸事情により(?)LT のほうは非公開です。
お、おまえ「Transactional」なんてサブネーム(?)が付いたのか#ChugokuDB pic.twitter.com/PNO2rcmGEn
— hmatsu47(まつ) (@hmatsu47) 2025年9月13日
HeatWave、ブランディングの迷走が災いしている感があります。
「HeatWave」が拡張機能だったりマネージドサービスのブランド名だったり立場がコロコロ変わった結果「Oracle社の」という指定でLLMに問いかけてもLLMが困惑して間違った答えを返しちゃう
— hmatsu47(まつ) (@hmatsu47) 2025年9月13日
(ググラビリティに代わる何か?)#ChugokuDB
LLM の Web 上公開データの学習もその迷走の影響を受けていて(+公式以外に言及している文献がほとんどなくて)正しい回答を生成できない、という面がありそうです。
on OCIは確かに安い
— hmatsu47(まつ) (@hmatsu47) 2025年9月13日
on AWSはそれほどでもない(けどAWSに払う金額を考えると「利益出るのか、これ?」みたいな)#ChugokuDB
HeatWave に限らず OCI は安いんです。もうちょっと引き合いがあっても良いと思うのですが。
Docswellにはお世話になってる(課金ユーザー)https://t.co/pbGjxsFYXJ#ChugokuDB
— hmatsu47(まつ) (@hmatsu47) 2025年9月13日
Docswell は(インメモリ・列指向の HeatWave エンジンはあまり活用できていないようですが)HeatWave を利用して提供されているサービスです。
1.5時間のバッチが2秒!?
— Natsuki (@natch_engr) 2025年9月13日
どういうクエリ叩いてたのか気になる#ChugokuDB
クエリそのものは出せないのですが(サンプルのクエリは公式が公開していますが、古いほうのサンプルについてはこちらの記事で扱っています)、普段 ヘーシャ で流している集計クエリについての結果は↓の資料の中で示しています(数分が数秒に)。
個人的にもいろいろ検証したhttps://t.co/sUuCpOaSUG
— hmatsu47(まつ) (@hmatsu47) 2025年9月13日
(ほかにHeatWavejpで何回か話した)#ChugokuDB
そして本題、GenAI です。
GenAI で対応・内包している LLM のモデルについては、
公式リファレンスの対応モデルのページ
— hmatsu47(まつ) (@hmatsu47) 2025年9月13日
(表にはなってない)https://t.co/K74fENkMhI#ChugokuDB
ちょっと微妙な部分がありますね。
なお、ストアドファンクションで GenAI 関連の機能が多数実装されていますが、
文脈のメモリーはどこまで残すかが悩ましいやつ(スライディングウィンドウみたいにするのか圧縮(要約)するのか)#ChugokuDB
— hmatsu47(まつ) (@hmatsu47) 2025年9月13日
(文脈を意識した)チャットも実装されているようです。
MySQL 従来のデータベースエンジン
— さく%モートレ(エアなし)仮運用中 (@S_a_k_U) 2025年9月13日
HeatWave インメモリで動作する分析基盤
-Lakehouse オブジェクトデータストア基盤
-AutoML 機械学習のトレーニング、推論、説明
-GenAI 組込みLLM(日本語は公式未対応)や外部LLMを利用した生成AI機能#ChugokuDB
-Vector Store ベクトル化(文章のみ画像はOCR対応)されたデータストアとして提供
— さく%モートレ(エアなし)仮運用中 (@S_a_k_U) 2025年9月13日
MySQLに蓄積された大量のデータを
HeatWaveで分析して
各種機能が利用できるエコシステム#ChugokuDB
少しは HeatWave に興味を持ってもらえた人がいれば嬉しいです。
(LT についてはオフレコのため省略)
休憩明けは石川さんより。
MongoDB は使ったことがないのですが、通常の RDBMS と同様、スロークエリログなど運用向けの情報は出力されるようです。
k6 で負荷を掛けてそのあたりの情報を利用して、
こういうの確かに
— ikkitang (@ikkitang) 2025年9月13日
ある程度線を引いてやらないと 「いい感じにやって!」 ではここまでいけないよね〜って思っている。#ChugokuDB
AIへの指示が的確だな #chugokudb
— mako📸 (@mako_wis) 2025年9月13日
「いい感じにチューニングして」ではなく適切な指示をすることによって、クエリのパフォーマンス改善ができた、というお話でした。
(が、1 つ改善できると次のボトルネックが表面化…というのはお約束ですね)
3 番手は私。
最初のほうで反省を書いたとおり、ちょっとメインテーマがぼやけてしまいました。
👀https://t.co/gf2qYJ2soG
— Natsuki (@natch_engr) 2025年9月13日
#ChugokuDB
一応 LlamaIndex の GraphRAG 向けインデックスではベクトル検索も併用するので。
SQL2023とか隔世の感があるかも(いろいろ気にしてたのはSQL99?勢
— さく%モートレ(エアなし)仮運用中 (@S_a_k_U) 2025年9月13日
#ChugokuDB
(SQL:2023 ではプロパティグラフ向けの構文をサポート)
最後は Imai さんでした。
LLM とは直接関係のないテーマですが、AI 時代だからこそ大事な話、ということで。
デスペ受けるとき午後2(当時)は迷わずスキーマ設計じゃなくてDBA問題を選択した勢#ChugokuDB
— hmatsu47(まつ) (@hmatsu47) 2025年9月13日
デスペ受験者としてはどちらかというとマイノリティです。
なおイミュータブルデータモデルの話がありましたが、
kawashimaさんのイミュータブルデータモデルの話、北海道の山川先生の研究室の(元)学生の方との共同セッションとしてJJUG CCC 2025 Springで発表されてた
— hmatsu47(まつ) (@hmatsu47) 2025年9月13日
(こちら↓はkawashimaさんじゃないパートの発表スライド)https://t.co/xlCfsYpsC7#ChugokuDB
kawashimaさんパートhttps://t.co/t3AFzVKRzE
— hmatsu47(まつ) (@hmatsu47) 2025年9月13日
JJUG CCC 2025 Spring のこのセッションでは私は部屋担当として進行のお手伝いをしていました。
`key や FK が変なときはテーブルに過不足がある`
— ikkitang (@ikkitang) 2025年9月13日
これ本当そう~.
複雑すぎるな?ってときは 一回 概念 -> 論理 を見直すとよい みたいなの思ってる#ChugokuDB
ライフサイクルの違うデータの混在とか、実際のプロダクトを見ると意外とあったりしますね。
(正規化されていなくて本来変わってほしくないデータも含めて上書きされてしまったり)
その後、懇親会では MySQL を取り巻く状況や、AI 時代にデータモデリングや AI で隠蔽されるレイヤの技術について、若手にどう伝えるか?の悩みの話などをしていました。
(半分、本編の延長戦みたいでした)
当初の予定より30分早く岡山を離脱
— hmatsu47(まつ) (@hmatsu47) 2025年9月13日
年内に1回また岡山に来ると思います
ありがとうございました!#ChugokuDB
12月の大都会岡山は参加したい
— hmatsu47(まつ) (@hmatsu47) 2025年9月13日
(東京のAI系カンファレンスは1週間後で被らなかったので)#ChugokuDB