56书库

手机浏览器扫描二维码访问

第312章 历景铄的神经网络模型进展(第1页)

第312章历景铄的神经网络模型进展

有了燧火这么一个趁手的算法工程工具,历景铄的神经网络算法研发进度可谓突飞猛进。

两个月前,经过多次尝试,他成功复现了当下学界比较流行的感知机神经网络训练结果,在手写数字识别任务上,已经达到了百分之七十的正确率。

这一成果在国内研究环境中,已然十分亮眼,但历景铄的目光并未就此满足,他深知前路漫漫,还有更多的未知等待探索,于是赶忙找到秦奕开始认真商量下一步的探索方向。

神经网络算法模型的研发有三大关键要素:数据、模型和优化算法。

在神经网络体系中,数据是极为重要的基础部分,数据的质量优劣、规模大小以及多样性程度,对模型的学习能力与泛化能力有着全面且关键的影响。

当数据足够多样时,模型便不会局限于学习某一类特定的数字特征,而是可以提炼出更具通用性、更普遍适用的特征模式,从而在面对从未见过的新数字样本时,也能准确识别。

但要是数据存在偏差,比如手写数字识别任务里的数据某些数字样本数量过多,而另一些过少,模型在学习时就会过度倾向于数量多的数字特征,使得对其他数字的识别能力大幅下降,严重损害泛化性能。

历景铄为了方便对比漂亮国学术界的研究成果,一开始没有去耗费大量精力构建自己独有的数据集,用的是漂亮国现成的数据集——漂亮国国家标准与技术研究院的公开NIST手写数字数据集。

这个数据集是前世被广泛应用于学术研究和工业实践中的手写数字识别领域基准测试数据集MNIST的前身,每个样本都是28×28像素的灰度图像,代表0-9之间的一个数字。

不过MNIST数据集包含六万个训练样本和一万个测试样本,而目前NIST数据集目前只有两万个训练样本和五千个测试样本。

随后,话题转到模型架构上,这是历景铄目前希望改进的重点。

他拿起一支笔,在纸上简单画了个神经网络结构草图,说道:“模型架构是神经网络的核心,具体分为网络结构和参数两大部分。”

“网络结构说白了,就是神经网络怎么组织,有几层,每层是什么类型,连接方式如何,信息又是怎么在各层之间流动,这是神经网络的‘骨架’,决定了网络的功能和适用场景。”

“网络参数呢,就是神经网络里要学习的权重和偏置,决定了网络怎么从输入数据里提取特征、做出预测。”

“现在学术界流行的多层感知机神经网络,是一种前馈神经网络,结构有输入层、隐藏层和输出层,神经元基本都是全连接。”

“我用的也是相同的结构,在处理28×28像素图像的时候,得把图像数据所有像素先展平成一维784长的向量数据,然后从输入层一层一层传到输出层,每层通过权重矩阵和激活函数做非线性映射。”

秦奕凭借前世的经验直接指出了当下多层感知机神经网络的缺点所在:“我觉得这个多层感知机这个神经网络目前至少有两个方面可以改进。”

“首先,它的每个神经元都得和上一层的所有神经元相连,这会导致整个神经网络的参数数量是网络层数的784倍,这么庞大的参数数量,会导致训练过程特别缓慢,还特别容易引发过拟合问题。”

“其次,因为它需要将所有像素展开成一维数据,这样会将原本图像数据中的笔画或者边缘这种特征丢失。”

历景铄听着,眼睛渐渐亮了起来,若有所思地说:“你是觉得我们可以适当减少不同层之间的网络连接,同时把保留输入数据的二维结构,接着在隐藏层里面针对二维矩阵进行学习?”

他突然一拍大腿,兴奋地说:“有了!我之前看到过瀛国科学家福岛邦彦的一篇论文,他好像就有差不多的思路!”说着,他快步走到那堆论文文件夹前,手忙脚乱地翻找起来,嘴里还嘟囔着:“在哪呢,到底放哪了……”

找了好一会儿,终于翻出一篇题为?Neocognitron?的论文,他连忙拿到秦奕面前,说:“秦哥,你看这篇名叫新认知机的论文,里面提出了局部感受野和层次化特征提取的思想。”

“他的网络结构包含S层和C层,S层也就是简单细胞层用卷积操作提取局部的二维空间特征,C层复杂细胞层则整合S层中一组简单细胞的输出,提取更高级的特征,这能在一定程度上减少网络里的参数。”

他赶紧去自己那一堆论文文件夹里面翻找了一番,然后拿出了一篇题为?Neocognitron?的论文给秦奕看:“这篇名叫新认知机的论文里面就提出了局部感受野和层次化特征提取的思想。”

这章没有结束,请点击下一页继续阅读!

“他的网络结构包含S层和C层,其中S层也就是简单细胞层用卷积操作提取局部的二维空间特征,而C层的复杂细胞层,整合S层中一组简单细胞的输出,提取更高级的特征,这一定程度上能减少网络里面的参数。”

秦奕接过这篇远没有杨立昆89年发表的卷积神经网络出名的论文,快速略读了一遍。

读完后,他发现里面的网络结构设计确实是跟后来引入了卷积层和池化层的卷积神经网络基本一致,只是因为这篇论文用的是无监督学习所以难以处理复杂的分类任务。

无监督学习和有监督学习是机器学习的两种主要范式,有监督学习使用标注过的数据即输入数据和对应的输出标签来训练模型,模型的目标是学习输入与输出之间的映射关系,无监督学习使用未标注数据来训练模型,模型的目标是发现数据中的潜在结构或模式。

秦奕点了点头说道:“我觉得这确实是一个很好的网络结构设计思路,我们可以把有监督学习和他这个网络结合起来,说不定就能在手写数字识别任务上取得突破。”

“另外,神经网络虽说是借鉴生物结构,但网络层命名也没必要弄得这么像生物术语,简单细胞和复杂细胞听起来都不知道是做什么的,我建议直接用操作命名就行,做卷积操作的叫卷积层,做池化操作的叫池化层,这样交流起来方便。”

“可以。”历景铄应道,“另外优化算法方面我们这边也遇到了一些问题。”

喜欢科技革命,从1984开始请大家收藏:()科技革命,从1984开始

拿我分尸镇国运,狼烟四起你慌了?  皇后断情绝爱,薄情帝王哭断肠  夫人逃婚后,少帅追妻不装了!  通冥神医  辐射海求生,从小木筏到黑珍珠号  年代:窝在深山打猎,我把妻女宠上天!  精神失常?我在废土养怪物!  全职御兽:我的灵宠全是大佬  你惹她干嘛?她一张符纸取你狗命  人在高中,离婚逆袭系统什么鬼?  重生七零:小知青搬空全家去下乡  征战诸天:从大宗师开始  重生83:从赶山开始发家致富  我最强不死兽,被剑骑学姐倒追  师妹结婚了,新郎不是我  逼我和亲?二嫁权臣后全家悔断肠  重生七零:冷面首长娇宠小辣妻  师娘要和离,宗门上下全慌了  本是无情人,怎奈有情生?  开局被捅我去你的男主男二  

热门小说推荐
女王嫁到:老公,太凶了

女王嫁到:老公,太凶了

一不小心绑定了个作死系统,墨抒开始了每天不作死就要死的生活。作为恶毒女配,她首先要让霸道总裁厌恶自己,还要撮合女主跟霸道总裁,必要时候伸出自己的脸让他们疯狂打一打,帮助他们结婚后就可以完美退位。于是墨抒为了活下去,每天都在战战兢兢花式作死,可一不小心居然把男神给作成了老公,每日每夜被他花式宠爱,这特喵是哪里出了错!!非快穿疯狂宠文爽文如果您喜欢女王嫁到老公,太凶了,别忘记分享给朋友...

全能小艺人今天红了吗

全能小艺人今天红了吗

超甜宠文1V1豪门某天,星娱旗下小艺人的马甲被扒了几个后,网友上网一搜,言岚。网友这些都你是的马甲?电竞男神?秀场男神?车神?服装设计师?场景经典布置师?言岚没有吧!我都没有披马甲,全部用的真名!墨霖少说了一个,我女神!网友男神求别闹,刚刚我们才喷这人喷出翔,你言岚表示包装自己的费用太高了,不整点副业怎么养主业。星娱系统不是宿主弱,是宿主太强!这是一个全能小艺人剧火人不火,歌红人不红的故事!言岚与墨霖结婚后,第一次体验到上热搜的感觉,确认过了,这是能帮她红的人!!网友就是这女人,蹭我家哥哥的热度!言岚墨霖她是我女神!黑子肯定是碍于这女人家的权势,说逼不得已说的。第二天,屠版商业头条和娱乐头条,墨家继承人。黑子肯定是商业联姻!墨霖我粉丝总拖我后腿,怎么破?什么时候才能抱走言岚!!墨霖撩了还想跑?言岚我没有!如果您喜欢全能小艺人今天红了吗,别忘记分享给朋友...

这该死的恋爱真上头

这该死的恋爱真上头

势利眼拾荒者VS偏执派隐藏大佬何婉八岁就不念书了,是淮城内着名的垃圾大王,周围方圆十里的大型垃圾场都是她的。某天,何婉突然在垃圾堆里扒拉出一个小屁孩,那个小屁孩一身污垢,像是从臭泥沟里出来的一样。何婉本来不想管他,却没想到那个小屁孩揪住了她的衣服不撒手,死活不肯松手,无奈,何婉就这样把他捡回了家。何婉以为自己捡了个废物回来,养在家里也是浪费粮食,整天想着如何把这个拖油瓶弄走。结果却没想到,自从把他捡来后,她的人生像是开挂了一样。多年后,何婉再次遇到自己当年捡来的那个拖油瓶,还没等抬腿开溜,就被他堵在了小胡同里当年遗弃老子遗如果您喜欢这该死的恋爱真上头,别忘记分享给朋友...

下堂春锦

下堂春锦

才子佳人的话本最是不可信。上一世的姜姝就是话本看多了,恋上新科平民状元样貌,一朝嫁娶才发现家有原配,堂堂侯门嫡女落得为人平妻。爱女惨死,生无可恋,一身荣耀却为她人做嫁衣裳。重来一世,看她下堂妇重为闺秀,只是红罗昏帐,重生回洞房花烛夜是怎么回事。洞房花烛,滚出~她要休夫!如果您喜欢下堂春锦,别忘记分享给朋友...

归来之前缘未了

归来之前缘未了

离去十年蹉跎岁月,归来已是勇者无敌。如果您喜欢归来之前缘未了,别忘记分享给朋友...

玩命挑战

玩命挑战

主播,还是观众?如果选择成为主播,您将会参与到我们为期三天的直播游戏节目之中,成为万众瞩目的明星!完成全部十项任务,拿到总决赛冠军,奖金总额高达一百万元!年度奖金高达一亿元!给你一个小目标,你今年就能完成它!如果选择成为观众,您可以投票决定主播将要挑战的任务!甚至亲自为主播量身打造各种任务!如果您喜欢玩命挑战,别忘记分享给朋友...

每日热搜小说推荐