一种基于赛马场思想的人工智能训练的改进方法

[复制链接]
查看1027 | 回复2 | admin | 2024-8-20 16:16:54 | 显示全部楼层 |阅读模式
一种基于赛马场原理的训练机制


1.意义与目的:
利用赛马场机制对多个相同目的的AI网络同步进行学习训练。
让每轮训练中,表现较差的其余AI网络向表现最好的AI网络表现效果靠近,最终达到整体网络集群进化。

2.实验应用场景:生成人脸GAN

3.使用的GAN网络:StyleGAN 、DCGAN、 WasserteinGAN

4.优越性对比参照标准:
通过使用赛马场机制训练得到的任一AI网络性能表现都优于此AI网络单独训练得到的性能表现。

5.评估方法:
使用以IS,FID为主,ACC,ROC,f1,RMSE等评估指标为辅的评估逻辑,来评估赛马场机制训练得到的GAN网络性能在相应分数上与传统训练方法得到的GAN网络性能的优劣。

6.实现原理:
1)多模型并行训练:在每一轮训练中,代码会并行训练多个GAN网络。每个GAN都有自己的生成器和判别器,且使用独立的优化器进行更新。

2)评估网络性能:通过evaluate_gan_performance函数评估每个生成器的表现。如IS或FID分数。

3)权重调整和微调:在每一轮训练后,评估表现最好的GAN网络。然后,通过将表现较差的网络的权重向最优网络靠拢的方式进行微调。这部分通过对参数做加权平均来实现,使得表现较差的网络能够逐步逼近表现最好的网络,而不是直接替换权重。

4)持续迭代与进化:通过迭代多轮训练,不断调整网络,使得整个网络集群逐步进化,提升整体性能。
回复

使用道具 举报

admin | 2024-8-30 15:42:26 | 显示全部楼层
这是我们的梦想:

[url=8.28 复制打开抖音,看看【Anzi的作品】AI赛马场,让天下没有难做的AI训练! 我有一个梦... https://v.douyin.com/ihknUAvG/ iCu:/ 10/23 S@Y.Mw]我们的梦想(复制后打开抖音)[/url]
回复

使用道具 举报

admin | 2024-9-9 17:57:22 | 显示全部楼层
今天研究赛马机制有一些新的感悟:
之前一直在纠结于GAN网络模型的异构,来装载到训练机制上面想要通过这个思路来证明训练机制的有效性;今天换了一个新方向:
使用相同的GAN网络模型结构,但使用不同的优化器(Adam、RSMPOP等),不同的生成器学习率(邻近区间内的梯度递减或者随机取得)。最终进行相同的训练后,平均FID分数下降更均匀,数值更优,突破之前的FID限制。在最终的生成图像的质量上,肉眼上看上去更高,可以说实现了整体能力的提升?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

媒体报道
如何抄在针尖上?
刘昱妗如何抄在针尖上?
如果有办法能让你抄在针尖上,你想不想学? 不需要复杂的指标,也不需要高深的技术,
交易模型测试库
宇晨交易模型测试库
目录 1.MACD日线 2.海6日线3.海龟S1日线 4.海龟S2日线
关于调delta的研究
刘昱妗关于调delta的研究
调备兑时间点 早晨9点,下午14:30,晚上21点 12.9 夜盘调delta 纸浆成交量为0 delta
文华各分区测试
宇晨文华各分区测试
////一楼////
test1
admintest1
test1
test1
admintest1
test1
交易SOP
刘昱妗交易SOP
日常任务及流程【金山文档 | WPS云文档】 交易sop https://www.kdocs.cn/l/cvXFT8HZDO
2025.12.1宽论解盘日报
dudu2025.12.1宽论解盘日报
大家好,欢迎来到宽论解盘。今天我们来用宽论的角度,一起解读上证指数近期的走势和
相关课程推荐
如何抄在针尖上?
如果有办法能让你抄在针尖上,你想不想学? 不需要复杂的指标,也不需要高深的技术,只要死磕这招盈亏比极
交易模型测试库
目录 1.MACD日线 2.海6日线3.海龟S1日线 4.海龟S2日线
关于调delta的研究
调备兑时间点 早晨9点,下午14:30,晚上21点 12.9 夜盘调delta 纸浆成交量为0 delta极小 此时期权的delta

22

主题

97

帖子

872

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
872
  • 官方论坛

    提供最新 Discuz! 产品新闻、软件下载与技术交流