← / → 切换 · 滚轮翻页 · 点右侧导航跳转
Wayne 研究室 · 技术图谱 · 2026.04.28
技术图谱 第一性原理 CEO 视角
AI 时代,GraphQL
还有意义吗?
从 GraphQL 到 MCP,从 Text-to-SQL 到 Semantic Layer
业务人员到底怎样最快取到数据库的数?
340% 企业增长
90% Text-to-SQL 准确率
MCP 横空出世
千图网落地视角
01 / 22
核心结论 · ONE-SENTENCE BOTTOM LINE
三句话讲完整份报告
先说结论,再看证据。
结论 ①
GraphQL 不会消亡
它正从「前端友好的查询语言」重构为 AI Agent 的数据底座。Apollo、Microsoft Fabric 已把 GraphQL Schema 直接转译为 MCP 工具。事实
结论 ②
业务取数范式被改写
从 SQL→报表→邮件,转向自然语言→Semantic Layer→图表。Snowflake Cortex 准确率从 51% 跳到 90%+。事实
结论 ③ · CEO 视角
选工具栈比选技术更重要
千图网应同时投资两条线:对外把 API 改造为 MCP-ready,对内用飞书 Aily/Wren AI 做业务 Self-BI。观点
下面用 16 页拆解:技术演进、行业实践、千图网落地。
02 / 22
第一性原理 · WHAT IS AN API ANYWAY
回到本质:API 到底在解决什么
API 的本质,是一份「信息契约」。
资源契约。服务端定义"用户/订单"等资源,客户端按 URL 取。
问题:复杂页面要打 N 次接口,过/欠取数。
字段契约。客户端声明"我要哪些字段",一次 query 全拿到。
问题:Schema 复杂,缓存/治理成本高。
能力契约。服务端广告"我能做什么",AI Agent 自己发现并调用。
为 LLM-first 设计的全新范式。
三层契约不是"取代"关系,而是"消费者"在变:人 → 前端开发者 → AI Agent。
03 / 22
基础回顾 · WHAT IS GRAPHQL
先确认共同语言
GraphQL 是「按需取数」的查询语言
客户端声明字段
query {
users {
name
posts {
title
}
}
}
— 客户端说要什么
服务端只返回所需字段
// 仅返回声明字段
{
"data": {
"users": [{
"name": "张三",
"posts": [
{ "title": "GraphQL 入门" }
]
}]
}
}
— 服务端按需返回
04 / 22
市场数据 · GRAPHQL ADOPTION 2026
事实 · 数据来自 GraphQL Foundation 与第三方调研
GraphQL 没有衰退,反而加速渗透
企业生产环境采用率
数据来源:GraphQL Foundation Report 2024、Wundergraph 2026 fact-check
340%
企业 GraphQL 使用量自 2023 年起增长
93% / 33%
REST 仍是主流,GraphQL 已抢占 1/3
关键判断:没有"取代",只有"分层"。REST 守稳定,GraphQL 攻复杂场景。
05 / 22
架构图谱 · THREE-LAYER API STACK IN AI ERA
2026 年的真实图景
三种 API 并存:服务三类不同的「消费者」
REST
面向机器接口
资源化、稳定、可缓存
✓消费者:第三方开发者、Webhook
✓典型:Stripe、Shopify Admin v1
✓未来:守住"开放标准接口"基本盘
GraphQL
面向复杂前端
字段级声明、按需聚合
✓消费者:移动 App、Dashboard
✓典型:Netflix、Shopify Storefront、GitHub
✓未来:作为 MCP 的Schema 底座
NEW
MCP
面向AI Agent
能力广告、动态发现
✓消费者:Claude / ChatGPT / Cursor / Agent
✓典型:Apollo MCP、Microsoft Fabric MCP
✓2024.11 由 Anthropic 推出,已成事实标准
"2026 年答案几乎总是: 不同边界用不同协议。" — Fordel Studios 决策框架
06 / 22
关键转折 · WHY AI AGENTS NEED MCP
本质区别:发现机制
REST/GraphQL 是硬编码,MCP 是动态发现
📜 旧范式:开发者读文档
开发者必须事先知道有哪些 endpoint、参数、返回字段,把调用代码硬编码到客户端。Schema 一变就要发版。
→ AI Agent 没法即时"读文档",更没法每次 Schema 变更都重训。
🤖 新范式:MCP Server 自我广告
服务端"广告自己有什么工具、什么参数",Agent 在运行时动态发现并选择。Schema 变了,Agent 自己刷新工具清单。
→ Agent 不写 GraphQL,只问"我要 X",MCP Server 内部用 GraphQL 取数。
💡
关键洞察:MCP 把 GraphQL Schema 作为内部实现,对外暴露的是"语义化的工具能力"。这不是替代,而是在 GraphQL 之上加一层"AI 友好包装"。观点
07 / 22
最佳实践 · APOLLO MCP + GRAPHQL ARCHITECTURE
2025.05 上线 · 已成事实标准
Apollo MCP Server:把 GraphQL Schema 一键转 MCP Tools
为什么是 GraphQL?
"把 MCP 加到每个 API会带来非确定性执行和 token 浪费。GraphQL 的查询计划提供确定性执行,只返回需要字段。" — Apollo
已落地谁
Microsoft Fabric、Indeed AI 实验、Wayfair 自动 mocking。Apollo 与 GraphQL Foundation 共同成立 AI Working Group(2025.10)。
08 / 22
实战案例 · ENTERPRISE GRAPHQL IN PRODUCTION
三个最该看的样本
大厂为什么还在押注 GraphQL?
70+ 微服务用 GraphQL Federation 整合,自研开源 DGS Framework。
✓Studio + Consumer 两条产品线
✓每天独立部署"数百次"
✓已开始接入 AI 实验
2018 推 GraphQL Admin API,已成内部默认协议。最近开放 Shopify MCP。
✓解决 REST 强耦合升级问题
✓开发者生态"按字段计费"
✓Cursor / Claude 已直连
把复杂 Repo/Issue 关系改造为 GraphQL;用户一次取所需字段,省成本。
✓REST + GraphQL 双轨保留
✓Copilot Agent 优先调 GraphQL
✓数据消费者: AI > 人类
共同模式:复杂业务关系 + 多端消费 + AI 即将成为最大客户。观点
09 / 22
话题转换 · FROM API TO BUSINESS DATA ACCESS
第二话题:业务团队
问题不是工程师,
是业务人员怎么取数。
GraphQL/MCP 解决的是系统之间的取数。
真正的瓶颈在运营、市场、客服、产品每天等数据团队跑 SQL 的低效循环。
"我有个想法,但等查到数已经下周了。"
— 几乎所有非技术岗的痛点
CASE · LinkedIn 内部 ChatBI
LinkedIn 给 PM、工程师、运营建了一个取数 chatbot,每周 300+ 活跃用户查数据湖。
→ 演示效果≠生产可用,语义层是关键变量。
下面看:行业已经发明了哪些让业务自助取数的新工具。
10 / 22
关键数据 · ACCURACY SHOWDOWN
事实 · 真实生产环境基准
Text-to-SQL 准确率从 51% 到 90%+
数据来源:Databricks Genie 评测、Snowflake Cortex Analyst 公布、VentureBeat 2025
裸 GPT-4o
~51%
直接对接表 = 业务人员"看上去能用",实际每两条错一条
Databricks Genie
~79%
Unity Catalog 治理,开箱即用
Snowflake Cortex Analyst
~90%+
需先建 Semantic View,门槛但 ROI 高
VentureBeat 关键结论:"语义层让 LLM 数据问答准确率提升最高 300%"。
11 / 22
架构图谱 · MODERN DATA STACK FOR BUSINESS
现代业务取数的标准三层
三层堆叠:哪层做对了,准确率就上来
L3
自然语言交互层 · NL Interface
对话式入口、图表生成、追问澄清 · Snowflake Cortex / Databricks Genie / Wren AI / Vanna / 飞书 Aily
L2
语义层 · Semantic Layer 🔑
把"GMV / 活跃用户 / 转化率"等业务术语一次性建模 · dbt Semantic Layer / Cube / AtScale / 阿里析言 MDL
L1
数据存储 · Storage
数据仓库 / 湖仓 / OLAP · Snowflake / Databricks / BigQuery / 阿里 MaxCompute / 飞书 Base
缺 L2 = LLM "瞎猜业务定义"。Gartner 2025:"语义技术是 AI 成功的不可妥协项"。
12 / 22
专题深入 · TEXT-TO-SQL + SEMANTIC LAYER
展开讲:这两个概念到底是什么
不是叠加,而是化学反应
什么是 Text-to-SQL
"自然语言 → SQL"
让 LLM 把"上月华东区销售 Top10 商品"这种人话翻译成可执行的 SQL 查询。
优非技术员工也能查数
劣表名/字段含义靠猜,准确率仅 50%
劣同名指标在不同部门定义不同 → "GMV 到底含税不含税"
什么是 Semantic Layer
"业务术语 ↔ 数据模型"翻译层
把 "活跃用户 / GMV / 转化率" 等公司级指标用代码(YAML)定义一次,所有工具/AI 共用。
作统一指标口径(避免"扯皮会议")
用代码版本控制 (Git),可审计
通BI / Notebook / AI 同一套定义
⚡
关键洞察:纯 Text-to-SQL 让 LLM "猜"业务定义;加上 Semantic Layer,LLM 只决定「调用哪个指标」,SQL 由 MetricFlow/Cube 确定性生成——准确率 51% → 100%(在覆盖范围内)。事实
13 / 22
工作流程 · END-TO-END FLOW
从用户提问到拿到正确答案
五步工作流:LLM 只做翻译,引擎保证正确
关键 ②
LLM 不再写 SQL,只决定调哪个 metric
关键 ④
SQL 由引擎确定性生成,无 join 错误
"语义层从不返回错误数据,它只会告诉你它无法回答。" — dbt Labs 2026 Benchmark
14 / 22
实操示例 · METRICFLOW YAML IN 60 SECONDS
看代码最快
一段 YAML 就是一个公司级指标
📄 metrics/revenue.yml
semantic_models:
- name: ecommerce_orders
model: ref('stg_orders')
defaults:
agg_time_dimension: order_date
entities:
- name: order
type: primary
- name: customer
type: foreign
dimensions:
- name: order_date
type: time
- name: channel # 渠道
type: categorical
measures:
- name: total_revenue
agg: sum
expr: revenue
metrics:
- name: gmv # 公司级指标
type: simple
type_params:
measure: total_revenue
filter: "status = 'paid'"
三个核心概念
EEntity 实体:表的主键/外键,定义如何 join
DDimension 维度:可以"按...切"的字段(时间、渠道)
MMeasure 度量:可聚合的数值(金额、订单数)
📊Metric 指标:业务定义(GMV = 已支付订单的金额求和)
这段 YAML 之后
所有人问"上月 GMV"、"双11 GMV 渠道分布"、"GMV 同比"——都用同一份定义。
→ Tableau / Excel / ChatBI / AI Agent 共享口径,告别"GMV 到底是哪个 GMV"。
本质:把"指标"从"BI 工具配置"升级为"工程级代码资产",可版本控制、可代码评审、可自动化测试。
15 / 22
大厂案例 · BIG TECH IN PRODUCTION
事实 · 都已生产部署
谁在用 Text-to-SQL + Semantic Layer?FAANG 已全员上车
对话式数据 Agent。建于单表 data marts + 元数据 semantic layer之上。语义层"已成为机器的控制平面,不只是分析师的工具"。
→ 关键动机:解决团队间指标重复与不一致
🏠
Airbnb · Dataportal
2017→2025
建了 8 年的数据民主化体系。Dataportal = 数据目录 + 语义层 + Data University 培训。数据民主化是战略优势。
→ 启示:语义层是体系工程,不是工具采购
💼
LinkedIn · Internal ChatBI
2025
PM/工程/运营 300+ 周活。但53% 准确率说明:没语义层,准确率上不去。LinkedIn 与 Uber 同样目的:解决跨团队指标重复。
→ 真实生产环境的诚实数据
🔍
Google · Gemini + 语义层
2024-2025
官方明确:AI 应该查询语义层,而不是生成原始 SQL。Conversational Analytics API + MCP 全部基于此架构。
→ 行业头部已对架构方向形成共识
行业模式:FAANG 不是在比"谁的模型更聪明",而是在比"谁的语义层覆盖更全、定义更准"。观点
16 / 22
工具地图 · ECOSYSTEM LANDSCAPE 2026
先认清楚每个角色
业务取数工具地图(按层级分类)
L3 · 端到端 ChatBI
SFSnowflake Cortex · 90%+ 准确率,需建语义视图
DBDatabricks Genie · 79%,Unity Catalog 加持
WRWren AI · 开源 GenBI 平台,12k★,自带语义层
VNVanna · 开源 RAG 风格,20k★,嵌入式
L2 · Semantic Layer
DBdbt Semantic Layer · MetricFlow GA 2024.10,YAML+Git 版本控
CBCube Cloud · API 优先 Headless BI,1s P95 延迟
ATAtScale · 企业级、和老 BI 工具兼容
OSOSI 标准(2025) · dbt+Cube 共建可移植
L1 · 数据底座
SFSnowflake · Cortex 原生,闭环最强
DBDatabricks · Lakehouse + Unity Catalog
AL阿里 MaxCompute / Hologres · 国内主流
FS飞书 Base · 字节多维表格,业务自建表
观察:L3 互相竞争,真正护城河在 L2——把业务术语建模沉淀为公司资产。观点
17 / 22
国内案例 · CHINESE ENTERPRISE PRACTICE
事实 · 国内已落地的 ChatBI
国内不是看客,是基准榜冠军
阿里云
析言 GBI
基于通义大模型,BIRD 榜单第一(超 IBM/Google/字节)。三模块:Schema 召回、SQL 生成、执行引擎。
→ 已用于阿里集团内部数百业务系统
中国一汽
GPT-BI 问数助手
覆盖研、产、供、销 9 大领域指标。从"等数仓出报表"变为"打开就问"。
→ 制造业 ChatBI 标杆
腾讯/星巴克
超声数 / NL2SQL
腾讯音乐超声数开放生态。星巴克探索 NL2SQL 让门店运营自查业绩。
→ 业务侧落地比工程侧更早
字节飞书
多维表格 + Aily
AI Agent 节点让业务人员用自然语言搭工作流,零代码自动化、智能查询、AI 字段。
→ 中小企业的最佳实践入口
关键洞察 · 千图网视角
国内 ChatBI 不缺技术,缺的是「业务定义沉淀」。"DAU"、"GMV"、"创作者活跃度"在不同部门定义不同,语义层是组织治理问题,不是技术问题。观点
18 / 22
整合视图 · UNIFIED MENTAL MODEL
把两件事合在一张图上
2026 数据访问大一统视图
关键洞察:四类消费者,四种接口,但都汇聚到同一个 Semantic Layer——这就是真正的"数据资产"。
19 / 22
CEO 视角 · QIANTU PLAYBOOK
从分析转向行动
千图网应该同时押两条线
对外 · API 战略
让 AI Agent 能"看见"千图网
1短期:把现有 REST API(搜索、收藏、下载)包装为 MCP Server,先支持 Claude/Cursor。
2中期:把素材元数据(题材、风格、版权)改造成 GraphQL Schema,作为 MCP 的语义底座。
3长期:成为 Agent 创意工作流的默认素材后端(类似 Shopify 之于电商)。
参考:Shopify MCP、Figma MCP 已上线 Cursor 商店
对内 · 业务取数
让运营/客服/创作者运营自助取数
1最快入口:飞书多维表格 + Aily Agent,把"千图业务核心 5 张表"接入,让运营 5 分钟内自助查。
2关键沉淀:建公司级 Semantic Layer("作品池"、"创作者等级"、"AI 使用度"等术语统一)。
3扩展:用 Wren AI(开源)或阿里析言 GBI 做生产级 ChatBI,与飞书并存。
真实痛点:客服查"昨天某主题下载量"还在等数据团队
⚠️ 不要只投 L3 工具。没有 L2 语义层,所有"自然语言取数"都在 50% 准确率徘徊。语义层是 CEO 必须主导的组织治理项目,不是数据团队的技术任务。
20 / 22
决策框架 · DECISION MATRIX
三种场景,三种选择
看场景对号入座:你到底该选什么
场景 1
面向
第三方开发者
→主推 REST + OpenAPI
→复杂场景补 GraphQL
→2026 加 MCP Server 服务 Agent
例:千图开放平台、Shopify Admin、Stripe
场景 2
复杂前端
多端聚合
→GraphQL + Federation
→Apollo 或自建 Gateway
→Schema 即 AI 的语义底座
例:Netflix Studio、千图网 Web+App+小程序
场景 3
业务人员
自助取数
→L1: 数据已就位
→L2: 投资 Semantic Layer
→L3: 飞书 Aily / Wren AI
例:千图网运营/客服/创作者运营
三个场景一句话总结:外部开放守住 REST、内部前端押注 GraphQL、业务取数投资 Semantic Layer。观点
21 / 22
总结 · CLOSING
一页带走
GraphQL 不死,
取数已变天。
事实
GraphQL 企业增长 340%,与 REST 在 67% 大企业并存。AI 时代角色:MCP 的Schema 底座。
事实
Text-to-SQL 准确率 51%→90%+,关键变量是 Semantic Layer,不是模型。
观点 · CEO
千图网双押:对外 MCP-ready API,对内飞书 Aily + 公司级语义层。
"消费者在变:人 → 前端开发者 → AI Agent。
谁先把语义层准备好,谁就拥有最强护城河。"
— Wayne 研究室 · 2026.04.28
Apollo MCP
GraphQL Foundation
Snowflake Cortex
dbt Semantic Layer
飞书 Aily
阿里析言 GBI
22 / 22