是否有“未经训练”的 gpt 模型文件夹?

Posted

技术标签:

【中文标题】是否有“未经训练”的 gpt 模型文件夹?【英文标题】:Is there an 'untrained' gpt model folder? 【发布时间】:2021-07-23 20:00:24 【问题描述】:

可能是一个疯狂的问题:但我想下载 gpt-2 模型框架,但我希望权重随机初始化。因此,就好像模型仍然需要在 reddit 内容(包括 json、词汇、元和索引文件等)上进行微调。这可能吗?

亲切的问候!

【问题讨论】:

【参考方案1】:

是的,可以随机初始化并从头开始训练。例如对于 T5,您可以这样做:

from transformers import GPT2Model, GPT2Config

config = GPT2Config.from_pretrained() # config as in the paper
model = GPT2Model(config)

【讨论】:

以上是关于是否有“未经训练”的 gpt 模型文件夹?的主要内容,如果未能解决你的问题,请参考以下文章

2023年AI十大展望:GPT-4领衔大模型变革,谷歌拉响警报,训练数据告急

2023年AI十大展望:GPT-4领衔大模型变革,谷歌拉响警报,训练数据告急

chatGPT笔记

OpenAI GPT-2 模型与 TensorFlow JS 一起使用

GPT分区,ens33没有网卡,Llnux挂载Windows文件夹

GPT系列论文