一种基于赛马场思想的人工智能训练的改进方法

[复制链接]
查看1126 | 回复2 | admin | 2024-8-20 16:16:54 | 显示全部楼层 |阅读模式
一种基于赛马场原理的训练机制


1.意义与目的:
利用赛马场机制对多个相同目的的AI网络同步进行学习训练。
让每轮训练中,表现较差的其余AI网络向表现最好的AI网络表现效果靠近,最终达到整体网络集群进化。

2.实验应用场景:生成人脸GAN

3.使用的GAN网络:StyleGAN 、DCGAN、 WasserteinGAN

4.优越性对比参照标准:
通过使用赛马场机制训练得到的任一AI网络性能表现都优于此AI网络单独训练得到的性能表现。

5.评估方法:
使用以IS,FID为主,ACC,ROC,f1,RMSE等评估指标为辅的评估逻辑,来评估赛马场机制训练得到的GAN网络性能在相应分数上与传统训练方法得到的GAN网络性能的优劣。

6.实现原理:
1)多模型并行训练:在每一轮训练中,代码会并行训练多个GAN网络。每个GAN都有自己的生成器和判别器,且使用独立的优化器进行更新。

2)评估网络性能:通过evaluate_gan_performance函数评估每个生成器的表现。如IS或FID分数。

3)权重调整和微调:在每一轮训练后,评估表现最好的GAN网络。然后,通过将表现较差的网络的权重向最优网络靠拢的方式进行微调。这部分通过对参数做加权平均来实现,使得表现较差的网络能够逐步逼近表现最好的网络,而不是直接替换权重。

4)持续迭代与进化:通过迭代多轮训练,不断调整网络,使得整个网络集群逐步进化,提升整体性能。
回复

使用道具 举报

admin | 2024-8-30 15:42:26 | 显示全部楼层
这是我们的梦想:

[url=8.28 复制打开抖音,看看【Anzi的作品】AI赛马场,让天下没有难做的AI训练! 我有一个梦... https://v.douyin.com/ihknUAvG/ iCu:/ 10/23 S@Y.Mw]我们的梦想(复制后打开抖音)[/url]
回复

使用道具 举报

admin | 2024-9-9 17:57:22 | 显示全部楼层
今天研究赛马机制有一些新的感悟:
之前一直在纠结于GAN网络模型的异构,来装载到训练机制上面想要通过这个思路来证明训练机制的有效性;今天换了一个新方向:
使用相同的GAN网络模型结构,但使用不同的优化器(Adam、RSMPOP等),不同的生成器学习率(邻近区间内的梯度递减或者随机取得)。最终进行相同的训练后,平均FID分数下降更均匀,数值更优,突破之前的FID限制。在最终的生成图像的质量上,肉眼上看上去更高,可以说实现了整体能力的提升?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

媒体报道
大论文配图
刘昱妗大论文配图
大论文所有配图
论文撰写/整合智能体
刘昱妗论文撰写/整合智能体
梁心怡的交易日记与反思
心怡梁心怡的交易日记与反思
总结、学习、改进
揭秘 “5000笔交易胜率90.5%” 轻量组冠军“吾剑”老师 深度访谈 干货满满 交易策略
心怡揭秘 “5000笔交易胜率90.5%” 轻量组冠军“吾剑”老师 深度访谈 干货满满 交易策略
说话人 1 00:00:00本次大赛,他用1,035元的本金在6个月的时间里翻了169倍。而更令人瞠
昱妗交易员日记
刘昱妗昱妗交易员日记
记录教训 吸取教训 前一天提出的问题改进时机:上午的10:30 (和第一次风控一起)
巴菲特眼中的赌博
桥博士巴菲特眼中的赌博
英雄不问出处,巴菲特曾经重注 运通公司 的股票 巴菲特重注运通公司(American E
工科女在线学交易
唯格工科女在线学交易
今天我基于一个明确的技术信号进行了开仓操作:昨天大盘的收盘价和盘中最高价均创出近
工科女的量化学习
唯格工科女的量化学习
今天动手跑了第一次批量回测,测试了5、10、15、30分钟四个时间周期的策略表现。主要
相关课程推荐
K线形态组合解析
k线图基础知识怎么学? 报名宽论VA鱼识别课
没有人可以做万能交易者,但通过不断学习吸收知识从而有一套属于自己交易系统的人,就是走向了盈利的大道。
90%的时间在研究大盘指数,9.9元学习宽论VA
一买就跌,一卖就涨? 股市七亏二平一赚,怎样才能成为赚钱的10%? 看准大盘胜算过半,炒股新手也能掌握的V

20

主题

95

帖子

892

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
892
  • 官方论坛

    提供最新 Discuz! 产品新闻、软件下载与技术交流