新闻中心 /News
乐竞体育官网追问daily 用AI帮你对线岁的自己;高脂饮食可能引发焦虑;大语言模型的推理能力存在显著不一致性
乐竞体育官网追问daily 用AI帮你对线岁的自己;高脂饮食可能引发焦虑;大语言模型的推理能力存在显著不一致性华盛顿大学的研究人员开发了一种结合全息声学设备与基因工程的非侵入性技术,能够精确调节大脑中的神经元。这项研究由华盛顿大学麦凯尔维工程学院和医学院的副教授Hong Chen领导,其团队包括Zhongtao Hu和Yaoheng Mack Yang。
AhSonogenetics是一种新型非侵入性神经调节技术,通过可穿戴的3D打印Airy波束全息超表面超声设备,精确调节经过基因改造以表达超声敏感离子通道的神经元。通过调节超声频率,研究团队能够在纹状体特定亚区内动态调整聚焦,实现灵活的神经调节乐竞体育。这项技术不仅能够灵活地刺激小鼠左右两侧的纹状体,还与在体钙记录兼容,无交叉干扰。最重要的是,AhSonogenetics可以双侧刺激,显著缓解帕金森病小鼠的运动缺陷。这一进展对于解决涉及多个脑区功能障碍的神经疾病(如帕金森病)具有重要意义。研究结果表明,该设备制造成本低廉(约50美元),可以根据不同脑部大小进行调整,具有广泛的应用潜力。研究发表在PNAS上。
加利福尼亚大学圣地亚哥分校的神经科学家团队通过研究证明,即使是小样本的神经影像学研究也能取得可重复的结果。研究团队由博士后Carolina Makowski博士和Terry L. Jernigan教授等人组成,旨在重新评估神经影像学在认知和行为预测中的潜力。
研究团队利用了青少年大脑认知发展(ABCD)研究数据库中的磁共振成像(MRI)数据,这些数据来自约12,000名九岁和十岁的儿童。传统上,神经影像研究依赖单变量分析,需要大量样本才能得出有意义的结果。然而,该团队通过多变量方法(multivariate methods)分析大脑数据,能够在较小样本中实现高效预测。
他们发现,基于任务的功能性MRI数据尤其有效,能够预测一般认知能力及相关行为。例如,训练样本中包含5,000名儿童时,只需40名复制样本即可预测认知能力。即使训练样本只有100名儿童,在60名复制样本中也能取得良好预测效果。该研究的重要性在于,重新打开了小样本研究的大门,许多资助较小数据集的研究项目因此得以继续推进。研究还表明,多变量方法能够有效利用大型数据集进行训练和调优,从而提升小样本研究的预测能力。
复旦大学冯建峰教授团队近日发布了全球首个基于数据同化方法开发的数字孪生脑(Digital Twin Brain:DTB)平台。该平台具备860亿神经元、百万亿突触,是国际上首个全人脑尺度的大脑模拟平台。
冯建峰教授的研究团队发现,数字孪生脑在规模和结构上越接近人类大脑,模拟出的数据与生物脑活动的实验记录在静息状态和任务状态下的相似度越高,并逐渐展现出类似于人脑的临界现象与认知功能。这一成果发表在 National Science Review 上。
科罗拉多大学博尔德分校的研究团队发现,高脂饮食不仅影响体重,还通过改变肠道菌群进而影响大脑化学物质,引发焦虑。该研究由综合生理学教授Christopher Lowry领导。
研究团队将青少年大鼠分为两组,分别给予标准饮食和高脂饮食(高脂饮食组的脂肪含量为45%,主要来自动物产品的饱和脂肪)。在为期九周的实验期间,研究人员定期收集粪便样本并分析肠道菌群多样性和组成。九周后,大鼠接受了一系列行为测试。
结果显示,高脂饮食组大鼠体重增加,肠道菌群多样性显著减少,特别是梭菌门(Firmicutes)增加,拟杆菌门(Bacteroidetes)减少。同时,研究发现高脂饮食组大鼠脑干中,与血清素生成和信号传递相关的基因(tph2、htr1a和slc6a4)在中缝背核(dorsal raphe nucleus)区域表达增加,这一区域与压力和焦虑反应密切相关。这表明高脂饮食可能通过改变肠道菌群,影响脑肠轴,进而引发焦虑。研究发表在Biological Research上。
主观意识的探索是神经科学的重要课题,特别是在没有外部视觉刺激的情况下,视觉工作记忆(VWM)的表现更为引人注目。为此,研究团队训练了两只猴子完成延迟匹配样本任务(DMTS),以探索初级视觉皮层(V1)在工作记忆中的作用。
在实验中,猴子通过观察并记忆不同方向的条纹图案,然后判断后续出现的图案是否与之前的相同。研究人员记录了猴子在任务过程中V1神经元的细胞外活动。结果显示,在记忆延迟期,V1神经元展现出与记忆内容相关的独特放电模式。具体来说,在记忆延迟期(刺激出现后700至1700毫秒),V1神经元在不同记忆内容之间的放电率存在显著差异,这种差异在错误反应和固定任务中不明显。进一步实验表明,这种记忆相关的神经表示能够抵抗干扰刺激,并且与感知外部视觉刺激的神经表示不同。
此外,V1的神经元对不同的记忆内容表现出动态的编码策略,这种编码与视觉输入编码存在显著差异。通过跨时间验证分析,研究发现记忆内容在延迟期的编码准确性显著高于刺激期,表明V1在不同记忆内容的表示上有独特的动态变化。这些发现揭示了V1在工作记忆内容表示中的关键作用,并提供了新的理解大脑如何处理和保持视觉记忆的信息。研究发表在 Science Advances 上。
一项由爱尔兰都柏林三一学院、智利阿道夫伊瓦涅斯大学和哥伦比亚哈维里亚纳宗座大学等机构联合进行的研究发现,目前基于高收入国家数据的大脑健康模型无法适用于拉丁美洲多样化的人群。
研究采用了元分析方法,分析了来自146,000名参与者的数据。结果表明,当前的健康老龄化模型未能考虑到拉丁美洲独特的社会经济和遗传背景。具体而言,拉丁美洲面临遗传混合(genetic admixture,影响基因变异和疾病风险)、童年不利经历、社会经济不平等以及健康差异等挑战。物理和社会环境对大脑健康的影响显著,与高收入国家观察到的模式不同。
元分析最终纳入了38项研究,其中28项评估了认知能力,10项评估了功能能力。结果显示,认知和功能能力的影响显著但存在异质性。研究发现,特定风险因素对功能能力的影响有限,人口统计学和心理健康有中等影响,而健康状况和社会决定因素的影响则较小。研究发表在 Nature Aging 上。
DeepSeek近期发布了其最新的开源模型——DeepSeek-Coder-V2。该模型在代码生成和数学推理能力上超越了GPT-4-Turbo,成为全球首个在这些领域竞争的开源模型。基于DeepSeek-V2的结构,DeepSeek-Coder-V2拥有236B总参数和21B激活参数,显示出卓越的性能。
DeepSeek-Coder-V2采用专家混合(MoE)架构,通过多个专家模型协同工作,提高了推理能力和效率。进一步预训练使其编码和数学推理能力大幅提升,支持的编程语言从86种扩展到338种,且上下文长度从16K扩展到128K,能够处理更长的输入内容。该模型分为236B和16B两个规模,满足不同应用需求。
在代码生成和数学推理的多个基准测试中,DeepSeek-Coder-V2表现优异。特别是在HumanEval、MBPP+、LiveCodeBench和USACO等测试中,其成绩显著超越许多闭源模型。此外,DeepSeek-Coder-V2在代码补全、代码修复和数学推理测试中也展现出强大的能力。例如,在GSM8K、MATH、AIME 2024和Math Odyssey等测试中,其表现卓越。
DeepSeek-Coder-V2的API服务支持32K上下文,价格与DeepSeek-V2一致。该模型和相关代码、论文全部开源,免费商用,无需申请,并支持API服务和本地私有化部署。虽然DeepSeek-Coder-V2在评测中综合得分更高,但与DeepSeek-V2相比,各有所长:前者擅长理科,后者更擅长文科。
Runway近日发布了其最新一代视频生成模型Gen-3 Alpha,该模型凭借更高的保真度和一致性,能够生成逼真的人类角色和动态场景。Gen-3 Alpha不仅支持多种视频生成和控制工具,还具备精细的时间控制和高质量的图像生成能力,使其在视频生成领域取得了显著的突破。
Gen-3 Alpha基于全新的大规模多模态训练基础设施,能够处理并融合不同类型的数据(如文本、图像和视频),生成高质量的多模态输出。通过联合训练的方法,该模型利用视频和图像数据进行学习,显著提升了生成动态和静态内容时的表现能力,确保输出内容的连续性和一致性。
Gen-3 Alpha支持从文本到视频、从图像到视频、从文本到图像的多种生成工具,并提供高度描述性和时间密集型的字幕,以增强对场景细节和时间变化的理解。通过细粒度的时间控制,模型能够实现对生成内容的精确关键帧设置和场景过渡,使生成的视频在运动和连贯性方面有显著提升。
此外,Gen-3 Alpha支持多种高级控制模式,包括运动画笔、先进摄像头控制和导演模式,提供了更大的创作自由和控制力度。分布式计算和高效存储架构的采用,确保了模型在处理大规模数据时的性能和速度,满足了高效创作的需求。
Gen-3 Alpha擅长生成逼真的人类角色,能够表现广泛的动作、手势和情感,开启了新的叙事机会。模型的训练由研究科学家、工程师和艺术家组成的跨学科团队协作完成,旨在解释各种风格和电影术语,为生成内容提供艺术美化。
近日,麻省理工学院(MIT)的研究人员开发出一款利用AI技术的聊天机器人,旨在通过模拟用户的未来,帮助人们做出更明智的生活选择。该项目希望通过与60岁的未来自我对话,改变用户对健康、金钱和工作的看法。
这款名为“你的未来”的聊天机器人,通过数字技术将用户的头像变老,同时生成可信的合成记忆,以用户的现有目标为基础,讲述其成功人生的故事。MIT媒体实验室的Pat Pataranutaporn表示:“我们的目标是促进长期思考和行为改变,从而激励人们在当下做出有利于长远健康和生活成果的选择。”
使用者首先需要回答一系列关于自己、朋友、家庭、过去经历和未来理想生活的问题,然后上传一张头像照片,程序会将其变老成60岁的样子。随后,程序将这些信息输入大型语言模型,生成丰富的合成记忆,以确保聊天机器人在回答问题时,有一个连贯的背景故事支撑。
该项目的试验涉及344名志愿者。结果表明,与聊天机器人的对话让人们感到焦虑减少,并与未来自我的联系更加紧密。这种更强的连接感应能鼓励人们做出更好的生活决策,例如专注于特定目标、定期锻炼、健康饮食和储蓄未来。
OpenAI的首席执行官Sam Altman最近向一些股东透露,公司正在考虑改变其治理结构。这一变动将使OpenAI从当前的非营利董事会控制下脱离,转变为营利性公益公司。这种结构上的调整可能为OpenAI的IPO铺平道路,目前公司的估值已达到860亿美元。
此次变动还将允许CEO Sam Altman持有公司股份,这是一些投资者一直推动的举措。Altman在与股东的讨论中提到的一个方案是将OpenAI转变为类似于Anthropic和xAI的营利性公益公司。
OpenAI近日宣布,美国退役将军Paul M. Nakasone加入其董事会,负责对OpenAI项目和运营的关键安全和保安决策提供建议。
Paul M. Nakasone是美国网络司令部(USCYBERCOM)的创始成员之一,并曾是其历史上任期最长的指挥官。此外,他还曾领导美国局(NSA),这个因大规模监控项目而备受争议的机构。他领导下的NSA因爱德华·登曝光的PRISM计划而闻名,该计划涉及广泛的数据收集和监控活动,侵犯了公民隐私权,并引发了国际社会的广泛批评和关注。
斯坦福大学医学院的研究团队在Leanne Williams博士的带领下,利用脑成像和机器学习技术,首次将抑郁症分类为六种生物亚型(biotypes)。
研究团队评估了801名被诊断为抑郁症或焦虑症的参与者,使用功能性磁共振成像(fMRI)技术测量其大脑活动。通过机器学习中的聚类分析方法,研究发现了六种不同的脑活动模式。其中一种亚型表现为认知区域过度活跃,对抗抑郁药物文拉法辛(Venlafaxine/Effexor)反应最佳;另一种亚型在静息状态下三个与抑郁症和解决问题相关的脑区活动较高,行为疗法效果更好;第三种亚型在控制注意力的大脑回路中活动较低,这些患者对行为疗法的反应较差。
Williams博士表示,这项研究首次展示了抑郁症可以通过不同的脑功能障碍来解释,从而实现了基于脑功能客观测量的精神健康个性化医疗。研究还发现,利用fMRI脑成像技术可以更准确地预测抗抑郁治疗的效果,准确率从不使用脑成像的36%提高到63%。研究团队还在探索更多种类的治疗方法,以期找到更多对标准抗抑郁药物无效患者的治疗选择。研究发表在Nature Medicine上。
伦敦大学学院计算机科学系的研究团队,包括Olivia Macmillan-Scott和Mirco Musolesi教授,最近发表了一项研究,探讨了大型语言模型(LLMs)在推理任务中的表现。
结果显示,这些模型在许多回答中表现出非理性,例如在相同问题上给出不同回答,并在简单计算中犯错。例如,GPT-4在Wason任务中的正确率为90%,而GPT-3.5和Google Bard则为0%。Llama 2 70b在10%的情况下错误地将字母K识别为元音,从而回答错误。
研究还发现,即使提供额外的背景信息,模型的回答也没有显著改善。这表明,尽管LLMs在某些方面比人类表现更好,但它们在推理任务中的表现方式与人类不同,且存在显著的不一致性。研究发表在 Royal Society Open Science 上。
复旦大学与上海 AI Lab 的研究团队通过将大语言模型与蒙特卡洛树搜索(MCTS)相结合,致力于提升 LLM 在复杂数学推理任务中的表现。他们提出了 MCT Self-Refine(MCTSr)算法,以应对当前 LLM 在策略和逻辑推理任务中的挑战,特别是解决奥数竞赛题等复杂数学问题。
研究团队将蒙特卡洛树搜索(MCTS)与LLM的 Self-Refine 和 Self-Evaluation 能力相结合,开发出 MCT Self-Refine(MCTSr)算法。该算法通过构建蒙特卡洛搜索树,利用选择、优化、自我评估和反向传播的迭代过程,优化了 LLM 的决策框架,并引入改进的置信上限(UCB)公式以平衡探索与利用。
实验结果显示,MCTSr 在 GSM8K 和 GSM-hard 等测试集上的表现显著提升。在不太复杂的 GSM8K 测试集中,随着迭代次数的增加,成功率显著提高。在更复杂的 GSM-Hard 测试集中,虽然成功率有所上限,但依然表现出色。此外,在 MATH 数据集的五个难度级别上,MCTSr 的成功率在各级别均有显著提升,特别是在 Level 1 难度上实现了 90.16% 的成功率。
随着脑健康研究领域的不断发展,人工智能(AI)在解释和分析神经数据中扮演着越来越重要的角色。BrainFounder是一种新型的医疗基础模型,通过整合来自41,400名参与者的大规模多模态磁共振成像(MRI)数据集,提出了基于视觉Transformer的双阶段预训练方法。
研究采用了两个阶段的预训练方法。第一阶段专注于编码健康脑的解剖结构,识别不同脑区的形状和大小。第二阶段则集中在空间信息上,包括脑结构的位置和相对位置。通过使用Brain Tumor Segmentation(BraTS)和Anatomical Tracings of Lesions After Stroke v2.0(ATLAS v2.0)数据集,对模型进行了严格评估。
BrainFounder在复杂的神经影像任务中表现出显著的性能提升,超过了使用完全监督学习的前沿解决方案。研究发现,增加模型的复杂性和使用大规模无标签训练数据,可以显著提高模型的准确性和预测能力。这项研究对医疗AI基础模型的创建具有变革性意义,并提供了实用的应用前景。
天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。如果您有进一步想要讨论的内容,欢迎评论区留言,或添加小助手微信questionlab,加入社群与我们互动。
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute, TCCl)是由陈天桥、雒芊芊夫妇出资10亿美元创建的全球最大私人脑科学研究机构之一,总部设在美国。TCCI与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了TCCI加州理工神经科学研究院。TCCI建成了支持脑科学研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括学术会议和交流、夏校培训、AI加速科学大奖、科研型临床医生奖励计划、特殊病例社区、中文媒体追问等。