構築中。

名古屋のITインフラお守り係です。ITイベントへの参加記録などを残していきます。

第 35 回 中国地方 DB 勉強会 in 岡山・ショートセッション枠参加(9/13)

発表枠では第 31 回のオンライン開催以来の参加となりました。

dbstudychugoku.connpass.com

いきなり反省から

第 31 回の発表のときも「話にメリハリがなかった」と反省していたのですが、今回は最終的に 20 分になるのか 30 分になるのかはっきりわからないまま、というか自分自身で決めないまま進めてしまったので、結果的に当日途中から説明をかなり端折ってしまい理解しづらい話になってしまいました。

20 分枠で喋るのであれば、できあがったデータの構造に着目するよりも「今回はこのような目的で非定型データ(文章)からグラフ構造を作ったけれど、別の目的、例えば◯◯であれば△△という Extractor を使えば□□をグラフ構造に落とし込んで定型データをグラフ構造に落とし込んで精度の高いコンテキストの取得ができる」という話に展開したほうが良かったもしれません。

もっとも、直前の週は大吉祥寺.pm 2025 へのスタッフ参加、そして 8 月下旬には「もしかしたら JAWS FESTA 2025 で Aurora DSQL の話をするかも?」と思ってクラウド LT 大会 vol.14 フリーテーマ!での関連発表(前フリというか FESTA で話す予定の内容の一部分を深掘りしたもの)の仕込みをしていたので、準備時間が足りなくなって結局 6 月に話した内容をほぼなぞる形になってしまいました。

(そして JAWS FESTA 2025 ではプロポーザルが通って本当に Aurora DSQL の話をすることになったので、同じ失敗を繰り返さないよう、準備を早めに進めます)

話は変わって…当日午前中

このところ天候が不安定で、前週の大吉祥寺.pm 2025 へのスタッフ参加のときも東京まで通常 2 時間弱のところ 5 時間掛かってしまったので、早めに岡山に着くよう新幹線で向かいました。

3 連休の初日だったこともあり名古屋から新大阪まで少し遅れ気味で進みましたが、新大阪以西はほぼ定刻通りで移動できました。

そのため、空いた時間で岡山シティミュージアムに立ち寄りました。

www.city.okayama.jp

まず入口側にある無料の岡山空襲展示室から見学。

空襲で市街地の 6 割が焼き尽くされた後、戦後はすごい勢いで住宅地や商業地域が復興していった様子を写真パネルで見ることができました。

続いて有料エリアへ。

www.city.okayama.jp

常設展でしたが初めて来たのでゆっくり見学することができました。

桃太郎伝説ゆかりの地として、地元愛知の犬山市も紹介されていました。犬山の桃太郎神社にはシュールな像などいろいろ置いてあって B 級スポット感満載なので、そういうのが好きな方は、老朽化で撤去される前に行ってみると良いかと…)

そして一旦駅に戻ってお土産を調達した後、適当な時間になったところで会場入りしました。

DB 勉強会本編

前半 2 セッション(1 セッション+1LT?)は日本オラクル山﨑さんから。

www.docswell.com

諸事情により(?)LT のほうは非公開です。

HeatWaveブランディングの迷走が災いしている感があります。

LLM の Web 上公開データの学習もその迷走の影響を受けていて(+公式以外に言及している文献がほとんどなくて)正しい回答を生成できない、という面がありそうです。

HeatWave に限らず OCI は安いんです。もうちょっと引き合いがあっても良いと思うのですが。

Docswell は(インメモリ・列指向の HeatWave エンジンはあまり活用できていないようですが)HeatWave を利用して提供されているサービスです。

クエリそのものは出せないのですが(サンプルのクエリは公式が公開していますが、古いほうのサンプルについてはこちらの記事で扱っています)、普段 ヘーシャ で流している集計クエリについての結果は↓の資料の中で示しています(数分が数秒に)。

そして本題、GenAI です。

GenAI で対応・内包している LLM のモデルについては、

ちょっと微妙な部分がありますね。

なお、ストアドファンクションで GenAI 関連の機能が多数実装されていますが、

(文脈を意識した)チャットも実装されているようです。

少しは HeatWave に興味を持ってもらえた人がいれば嬉しいです。

(LT についてはオフレコのため省略)


休憩明けは石川さんより。

speakerdeck.com

MongoDB は使ったことがないのですが、通常の RDBMS と同様、スロークエリログなど運用向けの情報は出力されるようです。

k6 で負荷を掛けてそのあたりの情報を利用して、

「いい感じにチューニングして」ではなく適切な指示をすることによって、クエリのパフォーマンス改善ができた、というお話でした。

(が、1 つ改善できると次のボトルネックが表面化…というのはお約束ですね)


3 番手は私。

www.docswell.com

最初のほうで反省を書いたとおり、ちょっとメインテーマがぼやけてしまいました。

一応 LlamaIndex の GraphRAG 向けインデックスではベクトル検索も併用するので。

SQL 標準(標準 SQL)も年々進化しているのです。

SQL:2023 ではプロパティグラフ向けの構文をサポート)


最後は Imai さんでした。

speakerdeck.com

LLM とは直接関係のないテーマですが、AI 時代だからこそ大事な話、ということで。

デスペ受験者としてはどちらかというとマイノリティです。

なおイミュータブルデータモデルの話がありましたが、

JJUG CCC 2025 Spring のこのセッションでは私は部屋担当として進行のお手伝いをしていました。

ライフサイクルの違うデータの混在とか、実際のプロダクトを見ると意外とあったりしますね。

(正規化されていなくて本来変わってほしくないデータも含めて上書きされてしまったり)


その後、懇親会では MySQL を取り巻く状況や、AI 時代にデータモデリングや AI で隠蔽されるレイヤの技術について、若手にどう伝えるか?の悩みの話などをしていました。

(半分、本編の延長戦みたいでした)