去年に続いての参加です。今回は朝から参加しました。
終わった後の感想を一言でまとめるとこれ。
今日は結構頭を使う話が多かったな、という顔をしながらクロージングセッションを聞いている。#pgcon23j
— hmatsu47(まつ) (@hmatsu47) 2023年11月24日
あと、今回は「猫も杓子も(象も亀も)Vector Store」という感じで、随所で pgvector への言及が見られました。
参加セッション
【K1】The Future of PostgreSQL: Fostering Adoption Through Extensibility(OrioleDATA / Korotkov さん)
朝一からディープな技術に触れるセッションでした。
PostgreSQL の拡張性の話に始まりテーブルアクセスメソッド(TAM)、WAL、バッファ管理など現状の問題点と OrioleDB での解決のアプローチの解説だった…のですが流石に詳細は理解できませんでした。
【K1】MySQLerとしてはPostgreSQLの複雑な共有バッファの構成とか概念とかあまりよくわかってない。
— hmatsu47(まつ) (@hmatsu47) 2023年11月24日
(MySQLでいうところのバッファプールだけじゃなくて個別の機能向けのバッファとかも含まれてそうだけど)#pgcon23j
MySQL の基本構造のほうが「シンプル」ですからね(最近はちょっとずつ複雑化していますが)。
【K1】完全に対象技術の知識がないと通訳できないタイプのセッション内容ですねこれは。#pgcon23j https://t.co/qJevkMGIvG
— hmatsu47(まつ) (@hmatsu47) 2023年11月24日
などと言っていましたが、次のセッションとの間に通訳さんが「私は開発者でもエンジニアでもない」とおっしゃっていて驚愕しました。
【K1】かなり技術寄りの課題を解決するために始めた事業、みたいなイメージ。#pgcon23j
— hmatsu47(まつ) (@hmatsu47) 2023年11月24日
「成果は最終的に OSS として PostgreSQL 本体へ」という話もされていたようなので、なおさら「日本では VC や投資家から資金調達するのが難しそうな事業だな」という感想が。
【K1】これをぜひ今年のアドベントカレンダーのネタにお願いしm(厳しすぎる)。https://t.co/esno2gxoLz#pgcon23j
— hmatsu47(まつ) (@hmatsu47) 2023年11月24日
無茶振りをぶち込んでみました。
【K2】PostgreSQL the way only Google can deliver it: A deep dive into AlloyDB(Google Cloud / Okan さん)
Google Cloud のマネージド DBMS、特に AlloyDB を中心としたセッションでした。
こちらのほうは自分でも(実際に使ったことはないけれど)把握していた内容がほとんででしたので安心(?)して聞けました。
【K2】Spannerだとキーの扱いとか完全に分散DBのそれっぽくて通常のRDBとは設計の考え方を変えなきゃいけないので、AlloyDBみたいな立ち位置のサービスがほしい、というのはわからなくもない。#pgcon23j
— hmatsu47(まつ) (@hmatsu47) 2023年11月24日
「Spanner と AlloyDB の使い分けがわからない」という反応が多かったのですが、Spanner は「RDB っぽく使える分散 DB」、AlloyDB は「Writer のスケールには上限があるけれど、よく使われる範囲で普通に高性能な RDB」と考えれば良いのではないでしょうか。
そして、Aurora などよりも後発なので、細かいところが工夫されている印象です。
【K2】列指向の実装方法、HeatWaveが「全体を列指向のメモリに突っ込む」→「MLを使って部分的にメモリに突っ込むことも可能」の流れで実装が進んだのに対し、AlloyDBが逆の流れっぽいのが趣深い(?)。#pgcon23j
— hmatsu47(まつ) (@hmatsu47) 2023年11月24日
HeatWave(MySQL)でも従来から「分析に関係ないカラムは HeatWave の列指向インメモリ DB に転送しない」指定はできたのですが、最近発表されたアップデートで AI/ML 自動判定ベースでカラムを選択して転送する機能が加わりました(HeatWave 側のメモリの節約が可能)。
「AlloyDB はキャッシュの一部、HeatWave は RDB 本体とは別の列指向インメモリ DB」への展開になる点は全然違いますけど。
【K2】バッファサイズのアドバイザーとかIndex Advisor的な機能、最近はOSSベースのマネージドサービスでも実装が増えてきた感。
— hmatsu47(まつ) (@hmatsu47) 2023年11月24日
(OSSそのものとマネージド版の差別化的な?)#pgcon23j
こちらも PolarDB とか HeatWave(MySQL)とか実例が増えている印象です。
【K2】AI/MLがベースだとたとえOSS版に実装されても動かすことができるプラットフォームが非常に限られそう。海外さんがお持ちの環境とか?#pgcon23j
— hmatsu47(まつ) (@hmatsu47) 2023年11月24日
LLM は API 解放で各社が学習して作った AI/ML のモデルが気軽に利用可能になった一方で、こちらはそう簡単には行かないですね。
【K2】「AlloyDB OmniをEC2で動かして◯◯する」みたいなネタをやろうとして他ごとで忙しくできないまま数ヶ月が経過した…。#pgcon23j
— hmatsu47(まつ) (@hmatsu47) 2023年11月24日
AlloyDB Omni については「知らなかった」という反応が多かったのが意外でした。
【K2】(AlloyDB AIのvector機能をOmniを使ってpgvectorと比較してみたいな、とも思ってたんだけど)#pgcon23j
— hmatsu47(まつ) (@hmatsu47) 2023年11月24日
pgvector についてはさすがに聞いたことがある人が多かったようですが、AlloyDB (AI) の Vector 関連機能についてはあまり馴染みがない反応でしたね。
【K2】ついでにラーメンDBをRAGで作りますか!?#pgcon23j
— hmatsu47(まつ) (@hmatsu47) 2023年11月24日
ぬこさんのラーメンデータベースのバージョンアップに期待!
【T1】今、改めて考える PostgreSQL プラットフォーム - コンテナからマルチクラウドまで -(NTTデータグループ / 小林さん)
(再)転職されてデータベースソムリエ業に復帰(?)された、こばさんのセッション。
AWS や Azure、Google Cloud などパブリッククラウド各社が直接提供するサービスと、それらの基盤上に Kubernetes と PostgreSQL を使って構築してユーザーに提供している DBaaS サービスを中心としたお話でした。
【T1】いまはDBaaS利用勢が過半数(まあこばさん周辺の人が母集団だから現実はもう少し違うかもしれないけど)。#pgcon23j
— hmatsu47(まつ) (@hmatsu47) 2023年11月24日
ここ数年で DBaaS 利用がなり伸びた印象です。
【T1】RDS,たしかに最近細かいオリジナル機能のアップデートが多い。#pgcon23j
— hmatsu47(まつ) (@hmatsu47) 2023年11月24日
AWS に限らず、クラウドベンダー各社はそれぞれ OSS に手を加えてサービス提供している…という話を(私が参加していない)別枠の 2 つか 3 つぐらいのセッションでも講演されていたようですね。
ポータビリティって、クラウド間で移動するって意味なのね。なるほどわかるなぁ。ここに来るまでに、AuroraのデータAlloyDBに持っていけないかなって考えていたので(検証目的だけど)ポータビリティは今後重要になりそう #pgcon23j
— tomo🫠 (@tomomo1015) 2023年11月24日
HeatWave on AWS についての意見を求められた際、「ここ↑大事ですよね」という感じで中の人にリクエストをしておきましたが…
【T1】クラウドベンダーはユーザーをロックインしたいでしょうしねー。#pgcon23j
— hmatsu47(まつ) (@hmatsu47) 2023年11月24日
本音はこれ↑でしょうね。
【T1】午前の話ともつながるけど、DBMSの機能にAI/MLを利用するものが含まれるケースが増えると「動作可能プラットフォームを選ぶ」感じになりそう。
— hmatsu47(まつ) (@hmatsu47) 2023年11月24日
(それ自体は汎用性を意識したものだったとしても、学習済みデータとか公開しないだろうなあ…)#pgcon23j
(データというかモデル)
— hmatsu47(まつ) (@hmatsu47) 2023年11月24日
午前の話と被りますが、LLM の API を提供する各社がユーザーからのリクエストに応えられず利用を待たせている現状(GPU 付きプラットフォーム不足?)を見ると、ちょっと不安が。
後編に続きます。
(iOS(iPadOS)のブラウザで X(Twitter) 埋め込み多用ページがリダイレクト多発で読めなくなっているので、やむをえず分割)