BERT如何在windows anaconda中运行预训练模型
Posted
技术标签:
【中文标题】BERT如何在windows anaconda中运行预训练模型【英文标题】:BERT how to run pretrained model in windows anaconda 【发布时间】:2020-01-24 01:05:00 【问题描述】:我目前正在探索this page 的模型,但我不确定如何运行以下代码
python run_classifier.py
--task_name=cola
--do_train=true
--do_eval=true
--do_predict=true
--data_dir=./data/
--vocab_file=./cased_L-12_H-768_A-12/vocab.txt
--bert_config_file=./cased_L-12_H-768_A-12/bert_config.json
--init_checkpoint=./cased_L-12_H-768_A-12/bert_model.ckpt
--max_seq_length=400
--train_batch_size=8
--learning_rate=2e-5
--num_train_epochs=3.0
--output_dir=./bert_output/
--do_lower_case=False
我创建了一个文件夹,我从 github 下载了所有代码。我在那个文件夹中有文件run_classifier.py
。
在同一个文件夹中,我创建了文件夹
data
它有 3 个 tsv 文件,如代码中所述。
bert_output
它是空的
cased_L-12_H-768_A-12
并且它具有模型的解压缩版本。
它有文件 bert_config.json
和 bert_model.ckpt
和
vocab.txt
然后我转到我的 anaconda 命令提示符并使用cd
命令转到上述文件夹并
(C:\Users\nnn\AppData\Local\conda\conda\envs\tensorflowspyder) C:\Users\nnn\Documents\GitHub\bert>python run_classifier.py task_name=cola do_train=true do_eval=true do_predict=true data_dir=./data/ vocab_file=./cased_L-12_H-768_A-12/vocab.txt bert_config_file=./cased_L-12_H-768_A-12/bert_config.json init_checkpoint=./cased_L-12_H-768_A-12/bert_model.ckpt max_seq_length=400 train_batch_size=8 learning_rate=2e-5 num_train_epochs=3.0 output_dir=./bert_output/ do_lower_case=False
Traceback (most recent call last):
File "C:\Users\nnn\AppData\Local\conda\conda\envs\tensorflowspyder\lib\site-packages\absl\flags\_flagvalues.py", line 527, in _assert_validators
validator.verify(self)
File "C:\Users\nnn\AppData\Local\conda\conda\envs\tensorflowspyder\lib\site-packages\absl\flags\_validators.py", line 81, in verify
raise _exceptions.ValidationError(self.message)
absl.flags._exceptions.ValidationError: Flag --data_dir must be specified.
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "run_classifier.py", line 981, in <module>
tf.app.run()
File "C:\Users\nnn\AppData\Local\conda\conda\envs\tensorflowspyder\lib\site-packages\tensorflow\python\platform\app.py", line 119, in run
argv = flags.FLAGS(_sys.argv if argv is None else argv, known_only=True)
File "C:\Users\nnn\AppData\Local\conda\conda\envs\tensorflowspyder\lib\site-packages\tensorflow\python\platform\flags.py", line 112, in __call__
return self.__dict__['__wrapped'].__call__(*args, **kwargs)
File "C:\Users\nnn\AppData\Local\conda\conda\envs\tensorflowspyder\lib\site-packages\absl\flags\_flagvalues.py", line 635, in __call__
self._assert_all_validators()
File "C:\Users\nnn\AppData\Local\conda\conda\envs\tensorflowspyder\lib\site-packages\absl\flags\_flagvalues.py", line 509, in _assert_all_validators
self._assert_validators(all_validators)
File "C:\Users\nnn\AppData\Local\conda\conda\envs\tensorflowspyder\lib\site-packages\absl\flags\_flagvalues.py", line 530, in _assert_validators
raise _exceptions.IllegalFlagValueError('%s: %s' % (message, str(e)))
absl.flags._exceptions.IllegalFlagValueError: flag --data_dir=None: Flag --data_dir must be specified.
-
我应该如何运行它?
我可以直接从 Spyder 执行吗?
【问题讨论】:
我认为 ./data/ 更像是 Linux,但你可能有 Windows。将这些选项切换为--data_dir=\data
或--output_dir=\bert_output
怎么样?那它有用吗?
【参考方案1】:
您只是缺少标志前面的双破折号 (--
):
python run_classifier.py ^
--task_name=cola ^
--do_train=true ^
--do_eval=true ^
--do_predict=true ^
--data_dir=./data/ ^
--vocab_file=./cased_L-12_H-768_A-12/vocab.txt ^
--bert_config_file=./cased_L-12_H-768_A-12/bert_config.json ^
--init_checkpoint=./cased_L-12_H-768_A-12/bert_model.ckpt ^
--max_seq_length=400 ^
--train_batch_size=8 ^
--learning_rate=2e-5 ^
--num_train_epochs=3.0 ^
--output_dir=./bert_output/ ^
--do_lower_case=False
(字符^
用于在windows提示符下表示续行,这样可以使命令的显示更整洁)
应该可以在 Spyder 中运行它,前提是您在执行脚本run_classifier.py
时传递参数。
【讨论】:
以上是关于BERT如何在windows anaconda中运行预训练模型的主要内容,如果未能解决你的问题,请参考以下文章
WIN10下使用Anaconda配置opencvtensorflowpygame并在pycharm中运用
win10 + 独显 + Anaconda3 + tensorflow_gpu1.13 安装教程(跑bert模型)
如何在windows窗口中运用C#读取txt,并在窗口中显示出来