BERT如何在windows anaconda中运行预训练模型

Posted

技术标签:

【中文标题】BERT如何在windows anaconda中运行预训练模型【英文标题】:BERT how to run pretrained model in windows anaconda 【发布时间】:2020-01-24 01:05:00 【问题描述】:

我目前正在探索this page 的模型,但我不确定如何运行以下代码

python run_classifier.py 
--task_name=cola 
--do_train=true 
--do_eval=true 
--do_predict=true 
--data_dir=./data/ 
--vocab_file=./cased_L-12_H-768_A-12/vocab.txt 
--bert_config_file=./cased_L-12_H-768_A-12/bert_config.json 
--init_checkpoint=./cased_L-12_H-768_A-12/bert_model.ckpt 
--max_seq_length=400 
--train_batch_size=8 
--learning_rate=2e-5 
--num_train_epochs=3.0 
--output_dir=./bert_output/ 
--do_lower_case=False

我创建了一个文件夹,我从 github 下载了所有代码。我在那个文件夹中有文件run_classifier.py

在同一个文件夹中,我创建了文件夹

data 它有 3 个 tsv 文件,如代码中所述。 bert_output它是空的 cased_L-12_H-768_A-12 并且它具有模型的解压缩版本。 它有文件 bert_config.jsonbert_model.ckptvocab.txt

然后我转到我的 anaconda 命令提示符并使用cd 命令转到上述文件夹并

(C:\Users\nnn\AppData\Local\conda\conda\envs\tensorflowspyder) C:\Users\nnn\Documents\GitHub\bert>python run_classifier.py task_name=cola do_train=true do_eval=true do_predict=true data_dir=./data/ vocab_file=./cased_L-12_H-768_A-12/vocab.txt bert_config_file=./cased_L-12_H-768_A-12/bert_config.json init_checkpoint=./cased_L-12_H-768_A-12/bert_model.ckpt max_seq_length=400 train_batch_size=8 learning_rate=2e-5 num_train_epochs=3.0 output_dir=./bert_output/ do_lower_case=False
Traceback (most recent call last):
  File "C:\Users\nnn\AppData\Local\conda\conda\envs\tensorflowspyder\lib\site-packages\absl\flags\_flagvalues.py", line 527, in _assert_validators
    validator.verify(self)
  File "C:\Users\nnn\AppData\Local\conda\conda\envs\tensorflowspyder\lib\site-packages\absl\flags\_validators.py", line 81, in verify
    raise _exceptions.ValidationError(self.message)
absl.flags._exceptions.ValidationError: Flag --data_dir must be specified.

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "run_classifier.py", line 981, in <module>
    tf.app.run()
  File "C:\Users\nnn\AppData\Local\conda\conda\envs\tensorflowspyder\lib\site-packages\tensorflow\python\platform\app.py", line 119, in run
    argv = flags.FLAGS(_sys.argv if argv is None else argv, known_only=True)
  File "C:\Users\nnn\AppData\Local\conda\conda\envs\tensorflowspyder\lib\site-packages\tensorflow\python\platform\flags.py", line 112, in __call__
    return self.__dict__['__wrapped'].__call__(*args, **kwargs)
  File "C:\Users\nnn\AppData\Local\conda\conda\envs\tensorflowspyder\lib\site-packages\absl\flags\_flagvalues.py", line 635, in __call__
    self._assert_all_validators()
  File "C:\Users\nnn\AppData\Local\conda\conda\envs\tensorflowspyder\lib\site-packages\absl\flags\_flagvalues.py", line 509, in _assert_all_validators
    self._assert_validators(all_validators)
  File "C:\Users\nnn\AppData\Local\conda\conda\envs\tensorflowspyder\lib\site-packages\absl\flags\_flagvalues.py", line 530, in _assert_validators
    raise _exceptions.IllegalFlagValueError('%s: %s' % (message, str(e)))
absl.flags._exceptions.IllegalFlagValueError: flag --data_dir=None: Flag --data_dir must be specified.
    我应该如何运行它? 我可以直接从 Spyder 执行吗?

【问题讨论】:

我认为 ./data/ 更像是 Linux,但你可能有 Windows。将这些选项切换为--data_dir=\data--output_dir=\bert_output 怎么样?那它有用吗? 【参考方案1】:

您只是缺少标志前面的双破折号 (--):

python run_classifier.py ^
--task_name=cola ^
--do_train=true ^
--do_eval=true ^
--do_predict=true ^
--data_dir=./data/ ^
--vocab_file=./cased_L-12_H-768_A-12/vocab.txt ^
--bert_config_file=./cased_L-12_H-768_A-12/bert_config.json ^
--init_checkpoint=./cased_L-12_H-768_A-12/bert_model.ckpt ^
--max_seq_length=400 ^
--train_batch_size=8 ^
--learning_rate=2e-5 ^
--num_train_epochs=3.0 ^
--output_dir=./bert_output/ ^
--do_lower_case=False 

(字符^用于在windows提示符下表示续行,这样可以使命令的显示更整洁)

应该可以在 Spyder 中运行它,前提是您在执行脚本run_classifier.py 时传递参数。

【讨论】:

以上是关于BERT如何在windows anaconda中运行预训练模型的主要内容,如果未能解决你的问题,请参考以下文章

WIN10下使用Anaconda配置opencvtensorflowpygame并在pycharm中运用

win10 + 独显 + Anaconda3 + tensorflow_gpu1.13 安装教程(跑bert模型)

如何在Pycharm中运用PyQT5创建Windows窗体

如何在windows窗口中运用C#读取txt,并在窗口中显示出来

如何在Anaconda / PyCharm Windows 10上安装TFLearn?

如何在Windows10下配置anaconda环境变量?