数据科学模型

DataScience

小yi数据科学模型(DataScience)是一种基于动态数据的生成式语言模型,生成的内容取自于经过特征工程治理后的高质量数据。

Data Acceleration
科学性
  • 参数来自于自身业务数据,与业务持续保持一致
  • 符号计算:使用图结构化架构表示复杂知识,求解复杂问题
  • 通过高维向量将模糊的、非标化自然语义描述匹配到标化数据
Data Acceleration

应用实践

加速表管理 数据查询与运算(聚合运算、规则运算、提示词智能体)
加速表管理 AI Data Agent任务识别与执行(填表、数据沉淀、风控任务)
加速表管理 数据交互(场景抽象、创作AI小程序)
加速表管理 与AI原生应用交互操作
长文本特征提取

依托数据科学模型,提取非结构化长文本特征,把原始数据转化为高质量结构化数据并存储。

非结构化文本解析→结构化数据生成→文档数据库存储→场景应用采用无监督学习的机制进行语义识别,完成非结构化文本特征提取。

Data Acceleration
患者约3月前无明显诱因出现一过性意识丧失,呼之不应,呕吐白沫,双眼上翻,家属诉无舌咬伤,无四肢抽搐,无大小便失禁,症状持续约半小时左右缓解,至当地医院就诊,完善颅脑MRI示脑内多发缺血、梗死灶,给予对症治疗(具体不详)。3 天前患者夜间再次出现一过性意识丧失,大喊大叫,呼之不应,伴双眼上翻,口吐白沫,家属诉带血丝,伴四肢不自主抖动,无大小便失禁,症状持续10分钟左右好转,至当地医院就诊,给予对症治疗。现患者为行进一步诊治来我院就诊,完善颅脑MRI后收入病房。

核心能力

加速表管理 自动识别非结构化长文本的语义关联。支持语义相似度计算与特征提取,补足了小样本、上下文不足等难题。
加速数据管理 数据逻辑的智能推理,对文本隐含的规则、对象及关系进行自动解析和逻辑推理,并嵌入逻辑结构验证数据一致性、正确性和可解释性。
加速数据管理 无监督学习的智能模型优化,以向量化方式表达文本,并保留语序和上下文信息,经无监督深度学习后,生成高质量、高维度的向量数据。

应用实践

加速表管理 将非结构数据中蕴藏数据特征与结构化数据融合到一起进行数据查询、分析
加速表管理 高阶的生命数据科学分析(关联分析、生存分析)
加速表管理 临床决策(单病种研究)
加速表管理 经营决策(DRG/DIP)
加速表管理 非结构化运营指标分析
模型微调工具和参数扩展
数据科学模型是一个客观的动态参数模型。利用模型微调工具可以将业务场景参数快速融入模型,并即刻生效。 医众同时提供参数扩展的增值服务,为用户的具体业务场景智能化提供模型训练相关服务。
Data Acceleration
AI应用
小yi智能助理
小yi智能助理是为用户提供的智能数据工程师。用户可以通过人机交互的方式,调用数据科学模型,在高维向量层智能查询、分析数据,规划、执行数据任务。
加速表管理
AI Data Agent
AI Data Agent是生成式数据智能体,能够智能理解数据需求,自动编排并执行数据任务。
加速表管理

核心能力

加速表管理 数据查询分析结果来源于数据科学模型的高质量数据,结果准确、权限可控
加速数据管理 通过场景抽象进一步修订查询语义范围,准确定位数据使用意图
加速数据管理 自动生成数据小程序,0代码、免部署、即开即用

应用实践

加速表管理 数据上报
加速表管理 智能运营报表
风控预警 风控预警