解析生物医学大数据，人工智能是最适用手段-全球播报

2023-06-16 07:23:42 来源: 科技日报

◎本报记者张佳星

当前最核心的生物医学大数据问题是解决各种可测量的数据，包括遗传密码与表观表型之间的关系问题。我们知道分子水平的基因组学、蛋白质组学研究产生的数据量不计其数，近年来发展起来的表型组学研究也在不断积累数据量，我们会逐渐拥有大量的表观数据。那么这两大数据如何偶联？如此规模巨大、系统复杂的分析只能由人工智能来完成。

近段时间，人工智能大模型展现了强大的自然语义处理能力，再次掀起了人工智能的研究热潮。从图灵测试开始，机器人能否与人对话就被用作判断机器是否具有高级别认知智能的依据。大模型的建立，让人工智能距离通过图灵测试更近一步。

【资料图】

那么，当前的人工智能还有哪些潜力？在生物医学领域应如何更进一步发展适用的人工智能？科技日报记者日前对中国科学院院士、中国科学院生物物理研究所研究员陈润生进行了采访。

生物信息数据量大、维度广

记者：距离人类遗传密码被破译已经过了20多年，但似乎仍有很多健康问题难以解决，这是为什么？

陈润生：过去我们认为生物网络是“单色”的，或者说是单因素作用的。因为当时我们认为具有生命功能的分子只有蛋白质，遗传物质经过转录、翻译的过程转化为蛋白质，进而执行生命活动中的各项功能。

基于这样的认知，人类遗传密码的破译被理解为解读“生命天书”。将人类全部30亿个碱基序列全部测序完成，就能读懂这部“生命天书”，提纲挈领地搞清生命活动的运转体系，从而揭开所有健康的秘密，获得解决健康问题的手段。

但现在我们发现，生物网络不是“单色”的，生命活动的调控、抑制、互作中，还有核酸的参与。比如有些核酸序列也会发挥之前被认为属于蛋白质的功能，调控细胞活动。在承载人类遗传信息的30亿个碱基对中，还有很大一部分虽然我们读出了序列，但并不知道功能，它们在生命活动中究竟起到什么作用也没有被研究清楚。大量这样的区域被称为遗传物质的“沙漠区”……因此，当前对人类遗传密码的破译进程只走了解决健康问题过程中的一小步。

记者：既然生命活动这么复杂，是否需要更多的生物信息数据才有希望破解健康难题？目前需要充分利用的有哪些维度的生物信息学数据？

陈润生：这30年来，人类遗传密码的破译带动着整个生物医学领域内广泛的数据都成为了大数据。

生物信息学最早的研究对象是遗传密码，研究任务是对遗传密码进行收集、整理、存储、发布、分析和解释。现在数据更广泛了，生物信息学的研究从20世纪八九十年代创立时的无信息可用，到现在数据呈现海量、多维、异质化特征。比如通过电子病历大数据挖掘，我们可以得到很多重要信息。中山大学一些研究人员通过电子病历分析找到的科学结论被发表在了国际著名期刊上。又比如可穿戴设备带来的生理生化指标，这类信息具备实时、环境情绪相关等特性。这些数据还包括医院中的影像学数据、临床病人在治疗用药后的病情变化数据、环境数据、微生物数据、地质数据、化学农药残留数据等。所有这些跟健康相关的数据集纳起来，构成了非常复杂的健康大数据类型。

可大幅提高生物信息处理能力

记者：如何解析复杂的健康大数据？

陈润生：健康大数据很复杂，举例来说，电子病历写的是字，处理这样的信息需要自然语言处理模块，生理生化指标如脑电、心电等信息需要处理的是波形图，而影像学要处理图像，组学要处理符号。对这些性质各异的生物信息进行全面提取处理，就如同秦始皇统一六国不仅要统一文字、语言，还要统一货币、度量衡，需要将不同的信息融通，再做解析和决策。

目前来看，要解析生物医学大数据，人工智能技术是最适用的手段。

记者：从最初的人工智能到阿尔法狗再到大模型，人工智能发生了哪些变化？当前的大模型在处理生物医学信息方面有哪些优势？

陈润生：20世纪80年代，由于受算力和算法的限制，我们能设计运行的人工智能神经网络非常简单，只有几层。

现在的人工智能神经网络，比如阿尔法狗、阿尔法折叠等，它的网络模型架构达到200—300层。当今的计算能力能够使它们完成更加复杂的任务。

人工智能大模型让人工智能更进一步。我认为大模型的出现表明人工智能有了多方面、更深刻的进展。第一方面是对自然语言的处理能力发生了根本性的变化。处理人类的自然语言对于计算机来说很困难，突破这个能力后，人工智能可以拥有全局性的知识作为计算的基础。

第二方面进展是具备了预学习能力。人类之所以能产生智慧，是因为从出生以来一直在不断积累学习。现在在大模型中，计算机已经可以预学习了，能够在大量的知识被预先获得的前提下，再将具体科学问题交给计算机，而不是针对某一个特定问题进行学习。

第三方面进展是可积极促进模态融合。模态融合可以这样理解，比如人工智能不仅能完成基础医学里的结构预测工作，还能完成临床医学中的识图判读工作，更重要的是可以把这两个能力融合起来，即人工智能在每个领域都具备专家的知识，又能够融会贯通、举一反三。

基于以上三点，我认为发展人工智能作为未来医学大数据挖掘的工具值得重视。

以人工智能解析生物医学大数据

记者：很多人在健康出现问题之后的第一反应是“为什么会这样”，以后人工智能可以解答这样的问题吗？

陈润生：想要回答“为什么会这样”这个问题涉及到人工智能界的两个提法：弱人工智能和强人工智能。弱人工智能就像阿尔法狗，能处理特定任务。而强人工智能被认为是有可能制造出来的、真正能推理和解决问题的智能机器。

所以你的问题其实是在问，强人工智能有可能出现吗？过去我认为是不可能的，但现在看来，我觉得随着大模型的出现，一些问题正在破冰，强人工智能有了出现的苗头和希望。当然，现阶段人工智能的发展与真正的强人工智能还差得很远。

当前我们正在进行一些与医学相关的人工智能研究。比如扩大健康问题相关的参数，抽提面部、表情等特征，也融合基因组、转录组、蛋白组、宏基因组、表观组等全部维度的特征，甚至加入了中医内容，通过多模态融合建造医学多模态数据智能整合计算平台，我们称之为“灵枢”，并将其用于医学健康问题的实践。

记者：网上有人调侃，能写论文的人工智能却无法解释清楚“驴肉火烧”“鱼香肉丝”，而生物医学领域对于人工智能的要求更高，您认为如何让人工智能具有更严谨的运行能力？

陈润生：如何才能让人工智能解释清楚“驴肉火烧”“鱼香肉丝”等人类世界的问题，其实是在问如何才能让人工智能达到强人工智能的水平。

人工智能的智能水平主要由三个因素决定：数据、模型和算力。数据掌握在用户手中，模型需要不断研发讨论精进，算力是由计算机的能力决定的。

从这三个决定因素入手，我们能够发现，在数据方面，要解决相应的科学问题，人工智能掌握信息量高、信噪比低的足够信息就可以了。在算力方面，要依靠计算机科学家不断从硬件等解决方案入手提高运算能力。

只有模型方面是值得研讨的，现在的模型理论够不够达到强人工智能的要求，如何让模型更强？

目前有几个途径可以让模型更强，即增加知识量、增加网络节点数、增加网络复杂度。当前国际上几个大模型的处理数据量已达到万亿参数级别，在此基础上，我认为需要进一步增加的是网络复杂度。

我们可以从生理学家的脑生理切片模型中得到启发。新生儿的脑神经网络很简单，复杂度不够，学不了多少东西。成长让人的脑神经网络逐步复杂，进而承载更多内容。因此，我们可以从研究脑发育中获得启发，进而形成一个更完善的基础理论框架，获得适用的模型，使人工智能走向强人工智能。

解析生物医学大数据，人工智能是最适用手段-全球播报

每日热点

解析生物医学大数据，人工智能是最适用手段-全球播报

新稳定疫苗或助消灭脊髓灰质炎_天天微速讯

微动态丨北京将16项辅助生殖项目纳入医保报销

“好评返现”方式不受好评

全国性行业协会商会收费自查自纠和抽检工作开展_当前独家

“最终解释权”成商家护身符 “霸王条款”如何终结？ 每日消息

16项治疗性辅助生殖技术项目纳入北京医保-全球观热点

每日聚焦：5月全社会用电量同比增长7.4%

热点评！浙江永强：6月14日公司高管谢建强减持公司股份合计10万股

天龙集团：6月14日公司高管王娜减持公司股份合计25万股

长川科技：6月14日公司高管钟锋浩减持公司股份合计25.57万股

鸥玛软件：6月14日公司高管袁峰、陈义学、张华英、马克、程伟减持公司股份合计5.44万股

沃太能源：关联交易涉嫌选择性披露 贡献3亿元收入的客户变对手或瓜分市场

市场监管总局：始终将药品作为反垄断执法重点领域

ST新研及子公司累计涉诉金额1876万元 投资者索赔仍在进行中

文化浸润乐居甸柳 社区文化有声有色 居民日子有滋有味_世界最新

晶华新材：6月14日公司高管周德标减持公司股份合计2.88万股 焦点要闻

佰仁医疗：6月13日范志豪减持公司股份合计500股

世界快看：药易购投资之殇：合作不成反被诉，对方要求赔偿近1亿

今日聚焦!东兴人，倒计时15天！6月30日前缴费可享受640元补贴，请尽快缴纳城乡居民医保费

怡球资源： 公司没有矿山，公司主要是对废旧资源进行再利用

通策医疗： 为实现逆势扩张，2022年公司人员处于扩张期 看热讯

海天瑞声： 感谢您的认可。公司严格按照募集资金相关要求进行相关项目的研发建设，并取得了预期成果-头条焦点

安科生物：6月14日至6月15日公司高管周源源增持公司股份合计57.71万股

世界观焦点：金禾实业(002597.SZ)：氯化亚砜是锂电池的上游原料，目前公司拥有年产8万吨的氯化亚砜产能

今日讯！新宙邦：拟以全资公司美国新宙邦为项目实施主体

世界消息！“剩菜盲盒”悄然走红 市场监管总局：销售食品盲盒要作出限定性表述

保障各方合法权益 市场监管总局启动优化平台协议规则专项行动_新消息

每日速讯：东莞邮政编码是多少号码（东莞邮政编码是多少）

苹果一体机怎么样外接显示器_苹果一体机怎么样|今日热门

要闻：惑星变异体5号副本平民_惑星

常青科技： 目前公司经营情况一切正常，具体生产销售数据请关注后续定期报告_今日讯

安徽建工： 本公司对其他上市公司情况不了解。股价受多种因素影响，投资有风险，请自行谨慎判断

全球实时：工业富联C位亮相“互联网+”博览会 五大主题展示一站式服务能力

圣达生物： 公司暂无上述所说的“长寿药”

黄山区发出首张行政处罚信用修复告知书

SUEZ亮相2023中国国际电子商务博览会 携手创业者共谋电商新红利

中国安储能源(02399.HK)：段惠元获任执行董事

西窗科技发布《泳装行业海外市场洞察》：泳装消费频次上涨，可持续性泳装受关注

每日热讯!湘潭：严管厚爱助力发展

全球快看点丨昂首挺立的意思怎么解释_昂首挺立的意思

[快讯]雪迪龙2022业绩创新高 入榜国内上市仪器公司TOP40 当前快报

浙商银行： 配股是上市公司向原股东按持股比例、以低于市价的某一特定价格配售一定数量新发行股票的行为-世界最新

世界速讯：金茂服务联手雄安雄建集团成立合资公司 将陆续承接后者项目

20款游戏未成年防沉迷权威测评：王者荣耀95分最高

农业农村部：到2030年全国设施农产品质量安全抽检合格率稳定在98% 世界微速讯

黑科技护肤让你更“好看”_环球热门

“夜猫子”立功了！“夜经济”爆火助推餐饮消费节节高

艾滋病、流感、新冠……都不易感？免疫分析揭示为何有些人不常生病

双鹭药业二股东被通报批评：减持达5%未信披并停止买卖-时讯

现货白银开户门槛一般是多少？

控股股东被申请破产审查 实控人成“老赖” 加加食品未来何去何从？_环球观焦点

电影《海门一号》首映 郭凯敏庐山恋后再恋海门

csgo每个箱子的钥匙不一样吗？csgo开箱钥匙都是17元吗？

* 天键股份：公司暂未掌握脑机接口技术

江南省造老银元价格（2023年06月15日）

* A股五家上市险企前5月保费收入合计超1.4万亿元|世界短讯

大幅调降硅片价格背后，千亿光伏龙头隆基绿能逆势扩产穿周期？ 世界微动态

联合光电：6月14日公司高管王浩减持公司股份合计2.62万股_观焦点

大货车双钱轮胎怎么样_双钱轮胎怎么样 天天观天下

csgo在手机上能开箱子吗？csgo开箱一发入魂概率是多少？

仙佑膏药发展趋势分析与展望 市场前景分析与预测

关于人类偏肺病毒，您关心的都在这里！ 天天讯息

全国新就业形态劳动者工会工作推进会召开 美团顺丰京东等企业参会 天天头条

广东省2023年建筑施工现场观摩交流会在中建八局招商银行总部大厦项目开展

移动手机短信发不出去（移动手机短信充q币）

世界观速讯丨他们眼中的“龙舟赛瞬间”

壳牌CEO：中国电动车充电站市场需求火爆，壳牌将“进一步加大投入” 世界视点

全市场都在狂欢，百济神州却崩了！啥情况？

上海：面向工业场景加快部署5G专网、千兆光网、算力平台等|新要闻

买卖贵金属投资平台有哪些？如何选比较好？

服务国家“双碳”战略 联想控股落子敦华绿碳 完善碳中和产业链布局

环球时讯：滴滴租车在全国300个城市上线服务

活力夜中国丨探寻一朵鲜花背后的科技力量

世界今日讯！“头雁归巴蜀·广办助你行”返乡创业考察走进四川苍溪

环球微动态丨水务领导者：数字水务技术拯救数百万社区

复星国际旗下复星医药再度入选“全球医药企业研发管线规模Top25”

国家文物局原副局长童明康逝世，曾为推动长城保护作出贡献

“最终解释权”成商家护身符 “霸王条款”如何终结？每日消息

沃太能源：关联交易涉嫌选择性披露贡献3亿元收入的客户变对手或瓜分市场

ST新研及子公司累计涉诉金额1876万元投资者索赔仍在进行中

文化浸润乐居甸柳社区文化有声有色居民日子有滋有味_世界最新

晶华新材：6月14日公司高管周德标减持公司股份合计2.88万股焦点要闻

怡球资源：公司没有矿山，公司主要是对废旧资源进行再利用

通策医疗：为实现逆势扩张，2022年公司人员处于扩张期看热讯

海天瑞声：感谢您的认可。公司严格按照募集资金相关要求进行相关项目的研发建设，并取得了预期成果-头条焦点

世界消息！“剩菜盲盒”悄然走红市场监管总局：销售食品盲盒要作出限定性表述

保障各方合法权益市场监管总局启动优化平台协议规则专项行动_新消息

常青科技：目前公司经营情况一切正常，具体生产销售数据请关注后续定期报告_今日讯

安徽建工：本公司对其他上市公司情况不了解。股价受多种因素影响，投资有风险，请自行谨慎判断

全球实时：工业富联C位亮相“互联网+”博览会五大主题展示一站式服务能力

圣达生物：公司暂无上述所说的“长寿药”

SUEZ亮相2023中国国际电子商务博览会携手创业者共谋电商新红利

[快讯]雪迪龙2022业绩创新高入榜国内上市仪器公司TOP40 当前快报

浙商银行：配股是上市公司向原股东按持股比例、以低于市价的某一特定价格配售一定数量新发行股票的行为-世界最新

世界速讯：金茂服务联手雄安雄建集团成立合资公司将陆续承接后者项目

控股股东被申请破产审查实控人成“老赖” 加加食品未来何去何从？_环球观焦点

电影《海门一号》首映郭凯敏庐山恋后再恋海门

大幅调降硅片价格背后，千亿光伏龙头隆基绿能逆势扩产穿周期？世界微动态

大货车双钱轮胎怎么样_双钱轮胎怎么样天天观天下

仙佑膏药发展趋势分析与展望市场前景分析与预测

关于人类偏肺病毒，您关心的都在这里！天天讯息

全国新就业形态劳动者工会工作推进会召开美团顺丰京东等企业参会天天头条

服务国家“双碳”战略联想控股落子敦华绿碳完善碳中和产业链布局

5月楼市延续下行态势业内：或有“二次探底”可能性

天天简讯:阳光照明：国内房地产市场低迷导致我国照明行业发展整体承压放缓

2024生肖大预言生肖羊人龙年劫难分析-当前热点

贵州省人民政府关于毛珏梅等任职的通知全球独家

世界快看点丨技术创新成为制胜关键仙佑膏药企业加强提升竞争力

大西洋：根据上级党组织批复，公司党委拟定于2023年6月份完成党委换届工作|全球聚看点

热点！【图解】5月主要能源产品生产保持增长天然气生产同比增长7.2%

焦点热门:国家统计局：5月70城新房价格环比整体涨幅回落二手住宅环比下降

每日简讯：大连热电：公司主营业务有明显的季节性属性，历年来二季度和三季度都是季节性停产检修

全球今热点：曝索尼无意提升苹果Vision Pro所需屏幕产量已拒绝苹果扩产要求

出险房企债务重组有新进展部分内房股进入完成复牌指引冲刺期_天天热资讯

全球微头条丨打印文件需扫码付钱：员工来上班办公费请分摊？

迈信林：目前公司在民用半导体生产销售正常，市场需求处于增长态势-天天热议

环球简讯:?[路演]东方炭素：特种石墨下游主要应用领域行业规模持续增加预计业绩持续增长

斯瑞新材：公司产品暂未应用于液冷服务器。祝您投资愉快！

天津港吸引更多货物中转聚集世界时快讯

沥尽心血怎么解释每日信息

什么是皇家律师热点评

康巴是什么意思资讯推荐

好看的都市剧电视剧排行榜都市剧电视剧排行榜前十名

七月一日是什么节日速递