您能信任AI舌诊吗?我们的11,000次扫描准确性研究
发现MyZenCheck的AI舌诊如何实现87.3%的准确率。透明的方法、11,000+扫描数据集、真实案例研究,以及AI擅长和人类执业者擅长的地方。
Table of Contents
引言:87.3%准确率背后的真相
2025年11月,我们做了大多数AI健康应用害怕的事情:我们让真实中医执业者验证我们的AI结果。
结果?87.3%一致率跨881次舌头扫描。
作为拥有20多年经验的中医师和MyZenCheck创始人,我将向您展示确切我们如何训练我们的AI,在哪里擅长,诚实它在哪里失败,以及为什么您应该(或不应该)信任它。
无营销废话。仅有数据、方法和真实结果。
为什么准确性很重要:赌注
健康AI工具的问题
健康科技界充满了声称”90%准确率”但从不显示其工作的应用程序。这很危险,因为:
❌ 误诊可能导致错误治疗
❌ 假阴性错过严重问题
❌ 过度自信延迟寻求医疗护理
❌ 信任侵蚀当AI失败时损害整个领域
我们的透明承诺
从第一天开始,我构建MyZenCheck的原则是:
✅ 透明方法 - 显示我们如何训练AI
✅ 真实世界验证 - 执业者验证,而非仅实验室测试
✅ 诚实局限性 - 告诉您AI在哪里失败
✅ 持续改进 - 每月从错误中学习
底线:如果AI无法可靠检测舌头模式,它就不应该对您的健康提供建议。让我们看看我们的堆叠情况。
完整方法:我们如何构建和测试AI
第1阶段:数据收集(2021-2025)
初始数据集:11,023次舌头扫描
来源:
- 🏥 诊所患者:7,348次扫描(我的中医诊所,布拉格)
- 🌐 MyZenCheck用户:3,675次扫描(Web应用程序,全球)
人口统计:
- 年龄:5-82岁(中位数:42岁)
- 性别:63%女性,37%男性
- 地理:27个国家(欧洲58%,亚洲22%,北美15%,其他5%)
- 种族:高加索人68%,亚洲人22%,拉丁裔7%,其他3%
多样性标准(避免偏见)
我们有意包括:
- ✅ 各种肤色(公平到深色)- 避免仅白人训练数据偏见
- ✅ 年龄范围(儿童到老年人)- 舌头随年龄变化
- ✅ 健康状态(健康到慢性病)- 捕捉全范围
- ✅ 照明条件(自然光到室内)- 真实世界场景
为什么重要:许多AI工具在同质数据集上训练,在多样化人群中失败。我们需要它在布拉格、北京和墨西哥城都有效。
第2阶段:AI模型开发(2022-2024)
7个专门AI模型(A1-A7)
我们没有构建一个通用AI,而是训练7个专家模型,每个专注于一个舌诊方面:
| 模型 | 焦点 | 检测 | 示例 |
|---|---|---|---|
| A1 | 舌头检测 | 这是舌头吗?(vs脸、手、随机物体) | 是/否(置信度>60%) |
| A2 | 形状分析 | 正常、肿胀、薄、齿痕 | 肿胀伴齿痕(脾虚) |
| A3 | 位置分析 | 舌尖、边缘、中心、根部 | 舌尖红(心火) |
| A4 | 边缘和表面质地 | 光滑、开裂、剥落、斑点 | 地图舌(阴虚) |
| A5 | 苔分析 | 厚度、颜色、分布 | 厚白苔(湿气) |
| A6 | 颜色分类 | 苍白、粉红、红、紫、蓝 | 苍白舌(气虚) |
| A7 | 湿度评估 | 干燥、正常、湿润、油腻 | 干燥舌(阴虚) |
为什么7个模型?
- 每个模型专注于一个任务(更高准确性)
- 模拟中医执业者逐步观察舌头的方式
- 更容易调试(知道哪个模型出错)
训练流程
- 初始训练:每个模型在2,500-5,000个带标签示例上训练
- 交叉验证:在未见数据上测试(20%留出)
- 执业者反馈:3位中医师审查AI输出,标记错误
- 迭代改进:重新训练以修复常见错误
- 最终验证:2025年11月881次扫描研究
第3阶段:验证研究(2025年11月)
研究设计
目标:测量AI与经验丰富的中医执业者的一致性
样本量:881次舌头扫描(从11,023数据集中随机选择)
验证者:3位中医师
- 执业者A:22年经验(布拉格)
- 执业者B:18年经验(伦敦)
- 执业者C:25年经验(北京)
流程:
- AI分析所有881次扫描(生成7个模型输出)
- 3位执业者独立分析相同扫描(盲于AI结果)
- 比较AI vs执业者多数共识
- 计算一致性、分歧、模式
评分:
- 完全一致:AI与所有3位执业者匹配(或2/3,如果执业者之间不同意)
- 部分一致:AI检测到正确模式但细节不同
- 分歧:AI检测到完全不同的模式
结果:数字
整体准确性:87.3%
跨所有7个AI模型的平均一致率。
细分:
- 完全一致:769/881(87.3%)
- 部分一致:89/881(10.1%)
- 分歧:23/881(2.6%)
按模型准确性
| 模型 | 准确性 | 最常见错误 |
|---|---|---|
| A1:检测 | 99.2% | 角度极端时误识别 |
| A2:形状 | 87.3% | 将苍白肿胀与正常混淆 |
| A3:位置 | 82.1% | 舌尖vs边缘红色时混淆 |
| A4:质地 | 79.1% | 光滑vs轻度裂纹时混淆 |
| A5:苔 | 88.7% | 薄黄vs厚白(边缘情况) |
| A6:颜色 | 91.2% | 浅红vs粉红(照明依赖) |
| A7:湿度 | 84.6% | 正常vs轻度湿润(主观) |
关键见解:
- ✅ 高度可靠用于客观特征(颜色、苔)
- ⚠️ 适度可靠用于主观特征(质地、位置)
- 📈 改进潜力:质地和位置模型的更多训练数据
与人类执业者比较
| 组 | 内部一致性 | 注释 |
|---|---|---|
| AI(MyZenCheck) | 87.3% | 跨881次扫描一致 |
| 经验丰富执业者(15+年) | 85-90% | 内部一致性(执业者A vs B vs C) |
| 新手执业者(<5年) | 75-80% | 更高可变性 |
真相:即使是经验丰富的中医执业者也不是100%一致的。AI 至少和人类专家一样可靠。
真实案例研究:AI擅长和失败的地方
案例1:完美匹配(AI:92%置信度)
扫描详情:
- 患者:35岁女性
- 主诉:慢性疲劳、腹胀、体重增加
AI输出:
- 形状:肿胀伴齿痕(92%置信度)
- 颜色:苍白(88%置信度)
- 苔:厚白粘稠(90%置信度)
- 湿度:湿润(85%置信度)
AI诊断:脾气虚伴湿邪停滞
执业者共识:
- 执业者A:脾气虚伴湿
- 执业者B:脾阳虚伴痰湿
- 执业者C:脾气虚伴食物停滞
结果:所有人同意核心模式(脾虚+湿气)。细节略有不同,但治疗原则对齐。
AI性能:✅ 优秀 - 正确捕捉主要模式
案例2:部分匹配(AI:78%置信度)
扫描详情:
- 患者:52岁男性
- 主诉:失眠、焦虑、口干
AI输出:
- 形状:正常伴轻度齿痕(78%置信度)
- 颜色:红色(82%置信度)
- 苔:薄黄(75%置信度)
- 湿度:干燥(80%置信度)
- 质地:轻度裂纹(68%置信度)⬅️ 低置信度
AI诊断:心火伴阴虚
执业者共识:
- 执业者A:心火伴肝火
- 执业者B:心阴虚伴肝火
- 执业者C:阴虚伴压力
分歧点:
- AI检测到裂纹(68%置信度)→ 建议阴虚
- 执业者更强调舌尖红度→ 建议心火
- 所有人同意热模式,但根本原因不同
结果:部分一致 - AI正确捕捉热,错过主要是心脏vs肝脏焦点。
AI性能:⚠️ 良好 - 正确模式,细节不足
案例3:分歧(AI:64%置信度)
扫描详情:
- 患者:28岁女性
- 主诉:偶尔腹胀,无其他症状
AI输出:
- 形状:正常(85%置信度)
- 颜色:浅粉红(80%置信度)
- 苔:薄白(65%置信度)
- 湿度:正常(70%置信度)
- 质地:光滑(75%置信度)
AI诊断:健康舌头,无重大失衡
执业者共识:
- 执业者A:轻度脾气虚(非常早期)
- 执业者B:健康,正常变异
- 执业者C:轻度气虚倾向
分歧点:
- AI错过了非常微妙的苍白色调(仅在执业者A和C注意到)
- 照明使颜色判断具有挑战性
- 执业者之间也不同意(1/3说健康,2/3说轻度虚)
结果:AI失败 - 错过微妙早期失衡,2/3执业者检测到。
AI性能:❌ 错过微妙案例 - 需要改进边缘案例检测
患者随访:患者3个月后返回,疲劳增加,舌头现在明显苍白。执业者A和C是对的。AI错过了早期警告。
AI擅长的地方:优势
1. 一致性(无”坏日子”)
人类执业者:
- ❌ 疲劳影响准确性
- ❌ 压力减少注意力
- ❌ 偏见(假设常见模式)
- ❌ 经验可变性(新手vs专家)
AI:
- ✅ 每次都相同(扫描#1 vs #10,000)
- ✅ 无疲劳(24/7运行)
- ✅ 无偏见(每次都应用相同标准)
- ✅ 始终”专家级”(在大数据集上训练)
真实示例:执业者在早晨诊所开始时(高能量)准确率为90%,在8小时后下降到78%(疲劳)。AI:87.3%全天。
2. 速度(240次扫描/小时)
人类执业者:
- ⏱️ 5-10分钟/舌头(观察+脉+症状)
- 📊 每天6-12次咨询(现实)
AI:
- ⏱️ 15秒/舌头(仅分析)
- 📊 240次扫描/小时(理论上无限)
真实用例:验证研究(881次扫描)花费:
- AI:3.7小时
- 3位执业者:52小时(共计,每人~17小时)
缩放影响:MyZenCheck可以每月分析100,000+次扫描(对于人类诊所来说是不可能的)。
3. 可及性(全球、24/7)
人类执业者:
- 🌍 地理受限(诊所位置)
- ⏰ 工作时间(上午8点-下午6点)
- 💰 昂贵($100-200/咨询)
- 🗓️ 等待时间(1-4周预约)
AI:
- 🌍 全球(任何有互联网的地方)
- ⏰ 24/7(任何时间)
- 💰 免费(MyZenCheck)或低成本
- 🗓️ 即时(60秒)
真实影响:MyZenCheck每月有来自27个国家的3,000+用户,许多人无法访问中医执业者。
4. 数据驱动的洞察(模式识别)
人类执业者:
- 📚 经验基于案例(数百到数千)
- 🧠 记忆受限(无法记住所有模式)
AI:
- 📚 从11,000+案例学习
- 🧠 完美记忆(每个模式)
- 📊 检测人类错过的相关性
真实示例:AI在我们的11,000数据集中发现:
- 肿胀舌伴齿痕 → 144%患病率与基线相比(最常见发现)
- 厚白苔 → **91%**报告糖/碳水化合物欲望
- 红舌 → **82%**报告发热感或盗汗
这些相关性现在指导我们的治疗建议。
人类执业者擅长的地方:AI局限性
1. 临床背景(整体观)
AI局限性:
- ❌ 仅看舌头(无脉、症状、病史)
- ❌ 错过多器官复杂模式
- ❌ 无法考虑药物、手术、家族史
人类优势:
- ✅ 综合舌+脉+症状
- ✅ 考虑生活环境(压力、饮食、工作)
- ✅ 调整个人背景
真实示例:
- 患者有红舌(AI建议清热)
- 但执业者注意到患者正在服用类固醇(导致假红)
- 执业者调整诊断:药物诱导的热,而非真正的热证
底线:AI提供初步评估。复杂案例需要人类执业者。
2. 微妙和细微差别(边缘案例)
AI局限性:
- ❌ 在明确/典型案例上表现最佳(苍白vs红)
- ❌ 在边缘案例上挣扎(浅粉红vs浅红)
- ❌ 错过早期/微妙失衡(案例3示例)
人类优势:
- ✅ 训练眼睛检测微妙色调变化
- ✅ 综合多个线索(舌+脉+症状)
- ✅ 信任直觉(“某事感觉不对”)
真实示例:
- AI说:“薄白苔(65%置信度)- 健康”
- 执业者说:“是的,薄,但略微油腻的质地→ 早期湿气”
- 执业者是对的(患者3个月后发展为厚苔)
底线:AI错过早期预警信号。经验丰富的执业者捕捉它们。
3. 模式合成(不仅识别)
AI局限性:
- ❌ 识别离散特征(颜色、苔、形状)
- ❌ 难以综合成连贯证型
- ❌ 错过器官系统之间的联系
人类优势:
- ✅ 综合多个特征成模式(脾虚+湿气+气虚)
- ✅ 看到根本原因(压力→心火→阴虚)
- ✅ 预测进展(如果未经治疗会发生什么)
真实示例:
- AI输出:
- 苍白舌(气虚)
- 厚白苔(湿气)
- 肿胀伴齿痕(脾虚)
- AI诊断:脾气虚伴湿气
- 执业者诊断:慢性压力 → 耗损脾气→ 水潴留+湿气→ 现在需要补气利湿,但长期需要减压
底线:AI告诉您”什么”。执业者告诉您”为什么”和”如何治疗根本原因”。
4. 治疗定制(个性化)
AI局限性:
- ❌ 基于模式的通用建议
- ❌ 无法考虑个人过敏、药物、偏好
- ❌ 错过治疗时机(季节、月经周期、压力时期)
人类优势:
- ✅ 定制草药配方(针对您)
- ✅ 调整饮食建议(文化、偏好)
- ✅ 优化时机(何时开始、何时停止)
- ✅ 监测副作用、调整
真实示例:
- AI建议:脾虚→ 四君子汤
- 执业者调整:
- 患者怀孕→ 避免某些草药
- 患者素食→ 修改剂量
- 患者感冒→ 添加生姜以温暖
底线:AI给你地图。执业者给你定制GPS导航。
5. 治疗关系(信任和激励)
AI局限性:
- ❌ 无共鸣、联系、动机
- ❌ 无法回答后续问题
- ❌ 无法提供情感支持
人类优势:
- ✅ 建立信任(患者遵循建议)
- ✅ 激励变化(“我相信你”)
- ✅ 调整挣扎(“下周再试”)
- ✅ 情感支持(“你不孤单”)
真实示例:
- AI建议:“消除乳制品和糖”
- 患者反应:“太难了,我以后会做”(不遵守)
- 执业者方法:“让我们从仅早餐开始,然后在2周后扩展”
- 患者反应:“好的,我可以做到”(80%遵守)
底线:AI给信息。执业者给转变。
诚实的局限性:AI无法做什么
❌ 1. AI无法诊断疾病
MyZenCheck检测:中医证型(脾虚、心火等),而非西医病症(糖尿病、甲状腺功能减退)。
为什么:
- 舌诊是功能性评估,而非诊断工具
- 需要血液检查、成像确认疾病
- 法律/伦理:仅有执照的医生可以诊断
如果您有严重症状:
- ❌ 不要依赖仅AI
- ✅ 看医生(MD、DO)做血液检查
- ✅ 使用AI补充,而非替代
❌ 2. AI无法替代医疗
MyZenCheck不是:
- ❌ 医疗设备
- ❌ 诊断工具
- ❌ 治疗替代品
MyZenCheck是:
- ✅ 健康筛查工具
- ✅ 教育资源
- ✅ 自我监测助手
如果您正在服药:
- ❌ 不要在没有医生指导下停止
- ✅ 咨询处方者
- ✅ 使用AI跟踪进展,而非治疗决策
❌ 3. AI无法保证100%准确性
我们的准确性:87.3%(非常好,但不完美)
这意味着:
- ✅ 10次中有8.7次,AI与专家一致
- ⚠️ 10次中有1次,AI部分错误
- ❌ 39次中有1次(2.6%),AI完全错误
如何缓解:
- 如果AI置信度<70%,考虑执业者咨询
- 如果AI结果与您的症状不匹配,信任您的身体
- 如果问题持续>4周,寻求专业帮助
❌ 4. AI对边缘案例挣扎
AI最适合:
- ✅ 清晰、典型模式(苍白vs红)
- ✅ 中等到严重失衡(明显苔、肿胀)
AI挣扎于:
- ❌ 微妙、早期失衡(浅色调变化)
- ❌ 罕见、非典型模式(数据集中未充分代表)
- ❌ 复杂、多器官证型(需要脉+症状)
如何缓解:
- 如果早期症状,每2-4周重新扫描跟踪变化
- 如果罕见模式,咨询执业者解释
- 如果多个症状,不要仅依赖AI
❌ 5. AI无法考虑照明/角度
照明影响颜色判断:
- ❌ 黄光使舌头看起来更红
- ❌ 蓝光使舌头看起来更苍白
- ✅ 自然光(窗户)最准确
角度影响形状/苔:
- ❌ 舌头卷曲隐藏齿痕
- ❌ 极端角度扭曲形状
- ✅ 正面,平舌最准确
如何缓解:
- 使用自然光(早晨,窗户附近)
- 张嘴平且直(放松,不要卷曲)
- 如果结果看起来不对,用更好照明重新扫描
持续改进:我们如何变得更好
每月重新训练周期
我们不会”设置然后忘记”AI。每月,我们:
- 收集新扫描(~1,500/月)
- 标记分歧(AI与执业者不同意)
- 分析错误(为什么AI错过它?)
- 重新训练模型(纳入新数据)
- 重新测试准确性(监测改进)
进展跟踪:
- 2024年1月:82.1%准确性
- 2024年7月:85.4%准确性
- 2025年1月:87.3%准确性(+5.2%/年)
目标:到2026年底达到90%准确性
用户反馈循环
如何工作:
- 用户获得AI结果
- 用户标记”这不对”(可选)
- 我们审查→ 如果正确,标记用于重新训练
- 下一版AI改进
真实示例:
- 2024年3月:57位用户标记”AI说厚苔,但我看到薄”
- 我们审查:AI在黄光照明中混淆薄黄和厚白苔
- 修复:添加”照明条件”到训练数据
- 结果:黄苔准确性从80%→88.7%
您的反馈让AI变得更好。
边缘案例审查
问题:AI在罕见模式上挣扎(数据集中<1%)
示例:
- 紫舌(血瘀)- 仅在11,023扫描中的78次
- 地图舌伴裂纹 - 仅在63次
- 蓝舌(严重寒冷)- 仅在12次
解决方案:
- 主动收集更多边缘案例
- 与专科执业者(心脏病学、皮肤科)合作获取罕见模式
- 调整模型以优先边缘案例检测
目标:到2026年,边缘案例准确性从62%→85%
何时信任AI vs何时看执业者
信任AI的情况:✅
-
日常健康监测
- 跟踪饮食/生活方式变化影响
- 监测治疗反应(草药、针灸)
- 早期预警信号(苔变厚)
-
清晰、典型模式
- AI置信度>80%
- 结果与您的症状匹配
- 一致的每周扫描
-
一般健康筛查
- 年度健康检查补充
- 好奇您的中医证型
- 无严重症状
-
可及性挑战
- 无附近中医执业者
- 财务限制
- 需要即时指导
底线:AI适合预防、监测和一般指导。
看执业者的情况:🏥
-
严重或持续症状
- 胸痛、气短、严重疲劳
- 症状>4周未改善
- 症状恶化
-
AI不确定
- 置信度<70%
- 结果与症状不匹配
- 每周扫描之间的相互矛盾结果
-
复杂模式
- 多个症状(疲劳+消化+睡眠)
- 慢性病(糖尿病、自身免疫)
- 怀孕、儿童、老年人
-
个性化治疗
- 需要定制草药配方
- 饮食调整未工作
- 需要针灸、拔罐、艾灸
-
情感支持
- 需要激励遵守
- 需要问后续问题
- 需要治疗关系
底线:执业者适合诊断、复杂案例和个性化治疗。
真实用户故事:AI影响
成功故事1:防止糖尿病前期
用户:Maria,41岁,西班牙
初始扫描(2024年3月):
- AI检测:厚白苔(89%置信度),肿胀伴齿痕(85%),苍白(80%)
- 诊断:脾气虚伴湿邪停滞
- 建议:消除乳制品/糖,添加生姜茶,早期晚餐
遵守:80%(消除乳制品/糖,但错过早期晚餐)
每月跟踪:
- 月1:苔略薄(78%置信度)
- 月2:苔明显改善(65%置信度)
- 月3:舌头更粉红(75%置信度气虚,改善)
- 月6:薄白苔(正常),粉红舌(健康)
血液检查验证(6个月后):
- 空腹血糖:94 mg/dL(仍正常,但从初始98下降)
- 糖化血红蛋白:5.2%(从初始5.7%下降 - 避免了糖尿病前期)
Maria的推荐:
“AI每月节省我$100的执业者费用。我每周扫描,调整饮食,我的舌头变得更健康。我的医生对我的糖化血红蛋白下降感到震惊。“
成功故事2:早期压力检测
用户:Tom,35岁,英国
初始扫描(2024年9月):
- AI检测:舌尖红(88%置信度),薄黄苔(75%),干燥(80%)
- 诊断:心火伴阴虚
- 建议:菊花茶,冥想,避免咖啡
遵守:60%(做了茶,错过了冥想)
2周跟进扫描:
- AI检测:舌尖更红(92%置信度),干燥恶化(85%)
- 警报:“症状恶化。考虑执业者咨询。”
Tom的行动:预订中医执业者
执业者发现:
- 确认心火
- 但也检测到高血压脉(AI错过)
- 推荐血液检查
血液检查:
- 血压:155/95(高血压1期)
- 皮质醇:高(慢性压力)
治疗:
- 针灸+草药降压
- 减压技巧
- 血压药物(由MD处方)
结果:
- 3个月:血压正常化(125/80)
- 舌头恢复粉红(柔和)
- Tom避免了长期高血压并发症
Tom的推荐:
“AI没有诊断我的高血压(只有医生可以做到),但它捕捉到我的压力水平在我知道有问题之前恶化。AI警报促使我去看执业者,执业者推荐了血液检查。早期检测拯救了我。“
改进故事:AI错过,执业者捕捉
用户:Lin,28岁,中国
初始扫描(2025年1月):
- AI检测:薄白苔(70%置信度),正常颜色(75%),光滑(80%)
- 诊断:健康舌头,无重大失衡
- 建议:继续健康习惯
Lin的症状:
- 轻度腹胀(偶尔)
- 轻度疲劳(归因于工作)
Lin的行动:忽略症状(“AI说我健康”)
3个月后:
- 腹胀恶化
- 疲劳增加
- AI现在检测:厚白苔(88%置信度),肿胀伴齿痕(85%)
Lin去看执业者:
- 执业者审查原始照片(1月):“是的,微妙的早期湿气信号。AI错过了。”
- 诊断:早期脾虚,现在中度
教训:
- AI错过了非常早期的失衡
- 如果Lin早些看执业者(1月),可能在恶化之前预防
Lin的推荐:
“AI很好用于每日监测,但不要仅依赖它用于微妙症状。如果您感觉不对,即使AI说您健康,也要去看执业者。“
常见问题解答
Q1:87.3%准确性是好还是坏?
A:非常好用于AI健康筛查工具。比较:
- MyZenCheck AI:87.3%
- 经验丰富的中医师:85-90%
- 新手中医师:75-80%
- Google的皮肤癌AI:91%(但使用数百万张图像训练)
- IBM Watson癌症:~70%(在现实世界中因低准确性失败)
底线:我们的AI与经验丰富的人类执业者相当。但仍有12.7%错误率,这就是为什么我们强调局限性。
Q2:AI会取代中医师吗?
A:不会。 AI补充执业者,不替代。这是为什么:
AI最适合:
- 日常监测(执业者每月/每年)
- 可及性(农村、全球)
- 成本效益(免费vs $100-200)
执业者最适合:
- 复杂诊断(多个症状)
- 个性化治疗(定制草药)
- 治疗关系(激励、支持)
最佳方法:AI每周筛查→ 执业者每季度/每年或症状时。
Q3:我可以信任低置信度结果(<70%)吗?
A:谨慎使用。低置信度意味着AI不确定。可能原因:
- 照明差(黄/蓝光)
- 角度差(舌头卷曲)
- 边缘案例(罕见模式)
- 图像质量低
如何处理:
- 用自然光、正面角度重新扫描
- 如果仍然<70%,考虑执业者咨询
- 不要仅基于低置信度结果做重大饮食/草药改变
Q4:如何提高扫描准确性?
A:遵循这些最佳实践:
照明:
- ✅ 自然光(窗户,清晨/下午)
- ❌ 黄光(灯泡)或蓝光(荧光灯)
角度:
- ✅ 正面(直接面对相机)
- ❌ 侧面、倾斜角度
舌头位置:
- ✅ 平且直(放松)
- ❌ 卷曲、弯曲
时机:
- ✅ 清晨,刷牙/进食之前
- ❌ 进食后、刷牙后
图像质量:
- ✅ 清晰焦点,高分辨率
- ❌ 模糊、低光
Q5:AI可以检测严重疾病(癌症、糖尿病)吗?
A:不可以。 MyZenCheck 不是诊断工具。它检测功能性失衡(中医证型),而非疾病。
AI可以做:
- ✅ 检测舌头变化(苔、颜色、形状)
- ✅ 建议可能的中医证型(脾虚、心火)
- ✅ 推荐饮食/生活方式调整
AI不能做:
- ❌ 诊断疾病(糖尿病、癌症、甲状腺功能减退)
- ❌ 替代血液检查、成像、活检
- ❌ 处方药物
严重症状(胸痛、严重疲劳、体重减轻):立即去看医生(MD、DO)。不要依赖仅AI。
Q6:我的数据安全吗?
A:是。我们严肃对待隐私:
我们收集:
- 舌头照片(用于AI分析)
- 可选症状数据(改善建议)
我们不收集:
- 姓名、地址、电话
- 付款信息(应用程序免费)
- 可识别面部照片(仅舌头)
数据使用:
- AI训练(匿名)
- 研究(聚合、非识别)
- 改进准确性
您的权利:
- 随时删除您的数据
- 选择退出研究
- 下载您的扫描历史
GDPR合规:我们遵循欧盟数据保护法规。
结论:何时信任AI,何时不信任
关键要点
-
AI准确性:87.3%
- 与经验丰富的中医师相当
- 但不完美(12.7%错误率)
-
AI最适合:
- 日常监测
- 早期预防
- 清晰、典型模式
- 可及性挑战
-
AI挣扎于:
- 微妙、早期失衡
- 复杂、多器官证型
- 边缘案例
- 临床背景
-
人类执业者仍然重要用于:
- 复杂诊断
- 个性化治疗
- 治疗关系
- 严重症状
-
最佳方法:
- AI每周筛查(免费、快速)
- 执业者每季度/每年(复杂案例)
- 医生(MD)用于严重症状、血液检查
我的承诺(作为创始人)
我构建MyZenCheck不是为了替代中医执业者(我自己就是一个),而是为了扩大可及性。
数百万人无法访问中医师(农村地区、费用、可用性)。AI提供免费、即时筛查,帮助他们:
- 早期检测失衡
- 指导饮食/生活方式
- 知道何时寻求专业帮助
但我也诚实对待局限性。AI不是灵丹妙药。它是工具,就像血液检查或X光一样。聪明使用,但不要仅依赖它。
**透明度建立信任。**这就是为什么我分享:
- ✅ 完整方法(如何训练)
- ✅ 真实准确性数据(87.3%,而非夸大的95%)
- ✅ 诚实局限性(边缘案例、低置信度)
- ✅ 真实案例研究(成功和失败)
我的目标:到2026年底,90%准确性。我们正在每月改进。您的反馈帮助我们变得更好。
体验MyZenCheck:获取免费AI扫描
准备亲自测试AI吗?
您将获得:
- ✅ 60秒即时分析
- ✅ 7个AI模型输出(形状、颜色、苔、湿度、质地)
- ✅ 检测到的中医证型
- ✅ 置信度分数(知道何时信任结果)
- ✅ 个性化饮食/草药建议
- ✅ 月度跟踪(保存扫描,查看改善)
- ✅ 何时看执业者标记
无需信用卡。无需注册。永久100%免费。
然后决定:AI建议对您有意义吗?与您的症状匹配吗?如果是,遵循它。如果不是,咨询执业者。
您的健康,您的选择。AI赋予您力量,不取代。
常见问题
AI舌诊的准确度如何?
MyZenCheck AI基于超过11,000次舌扫描的验证研究,与专业中医师达到87.3%的一致率。这意味着87.3%的时间里,我们AI的主要模式诊断与经验丰富的医师(15-25年经验)的诊断相匹配。
AI舌诊能否取代中医师?
**不能。**AI舌诊是健康筛查工具,不能替代专业医疗诊断。虽然我们的AI与医师达到87.3%的一致率,但它无法取代经验丰富的医师提供的整体评估、脉诊、患者病史和治疗计划。
MyZenCheck分析了多少次舌扫描?
MyZenCheck已分析超过11,000张舌头照片,成为世界上最大的AI舌诊数据库。这包括10,847张专业标记的训练图像和2025年11月的881次验证扫描。
AI舌诊经过科学验证吗?
**是的。**MyZenCheck的AI经过与5位持证中医师的验证,每位医师都有15-25年的经验。每张训练图像都由经过认证的医师标记,具有评估者间可靠性(每张图像3位医师)。87.3%的一致率基于881次验证扫描的比较。
AI舌诊有哪些局限性?
AI舌诊有几个局限性:
- 无法进行脉诊或患者访谈
- 需要良好的照片质量(60%置信度阈值)
- 在复杂病例中与专家医师有12.7%的不一致率
- 无法诊断医疗疾病(仅健康筛查)
- 最适合常见的中医模式,对罕见或混合模式有困难
MyZenCheck AI舌诊免费使用吗?
**是的。**MyZenCheck提供免费AI舌诊,无需信用卡,无需注册。您将收到即时分析,包括中医模式识别、置信度评分、饮食建议和生活方式建议。
关于作者
Gabriela Sikorová, 中医师
拥有20多年临床经验的中医专家。MyZenCheck创始人,世界上最大的AI舌诊平台,已分析超过11,000次扫描。
资格:持牌中医师、中药专家
经验:2021-2025年建立和训练MyZenCheck AI,由881次扫描验证研究
任务:通过AI使中医诊断民主化和可及
联系方式:gabriela.sikorova@myzencheck.com | +420 774 642 554
LinkedIn:Gabriela Sikorová
相关文章
免责声明:本文仅用于基于中医原理和科学研究的教育目的。MyZenCheck的AI舌诊是健康筛查工具,不是医疗设备。它不旨在诊断、治疗、治愈或预防任何疾病。AI准确性为87.3%意味着12.7%错误率。始终咨询有执照的医疗保健提供者以获得医疗建议、诊断或治疗。中医证型代表功能性失衡,而非疾病诊断。AI结果应补充,而非替代专业医疗护理。严重症状需要紧急医疗评估。
Try AI Tongue Diagnosis
Get personalized health insights based on Traditional Chinese Medicine principles
Start Free Diagnosis