markdown 网络スクレイピングした内容を喋らせ,适切にファイル分割する

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了markdown 网络スクレイピングした内容を喋らせ,适切にファイル分割する相关的知识,希望对你有一定的参考价值。

# Open JTalk のインストール手順

*OS はubuntu 14.04 LTS*

```
sudo apt-get install open-jtalk
sudo apt-get install open-jtalk-mecab-naist-jdic
sudo apt-get install libhtsengine1
sudo apt-get install htsengine
wget http://kr.archive.ubuntu.com/ubuntu/pool/multiverse/h/hts-voice-nitech-jp-atr503-m001/hts-voice-nitech-jp-atr503-m001_1.05-1_all.deb
sudo dpkg -i hts-voice-nitech-jp-atr503-m001_1.05-1_all.deb
sudo apt-get install alsa-utils
```

# 女声のインストール
## sourceforgeからダウンロードして解凍
```
unzip MMDAgent_Example-1.4.zip
```

解凍したディレクトリに移動し、htsvoiceディレクトリにコピー
```
cd MMDAgent_Example-1.4/Voice
cp -R mei /usr/share/hts-voice
```

# 実行コマンド
## 男声
```
open_jtalk -m /usr/share/hts-voice/nitech-jp-atr503-m001/nitech_jp_atr503_m001.htsvoice -ow output.wav -x /var/lib/mecab/dic/open-jtalk/naist-jdic test.txt
```

## 女声
```
open_jtalk -m /usr/share/hts-voice/mei/mei_happy.htsvoice -ow output_mai.wav -x /var/lib/mecab/dic/open-jtalk/naist-jdic test.txt
```

# 注意
※text.txtは改行があるとそれで読み込みが終了するので注意

# 改善したい点
* [ ] 内容が長すぎると途中で切れるのでオプションなどでなんとかできないか?
  1024バイト超えるとエラーになるっぽい
* [ ] 英語が来るとアルファベット読みになるためなんとかならないか?辞書がダメ?




# スクレイピング処理
```php
<?php

require_once 'vendor/autoload.php';

use Goutte\Client;

$client = new Client();
$crawler = $client->request('GET', 'http://hogehoge.com/fuga/');
// 音声変換する記事を配列に格納していく
$news[] = $crawler->filter('h2.title')->first()->text();
$news[] = $crawler->filter('p.simpara')->first()->text();
$crawler->filter('p.para')->each(function ($element) use (&$news) {
    $news[] = $element->text();
});

unset($client, $crawler);

// 音声に変換していく
foreach ($news as $line) {
    echo $line;
}
```


# 生成されたwavファイルをsoxを用いて結合する

## soxのインストール
```
$ sudo apt-get install -y sox
```

## wav ファイルの結合
```
$ sox [wavファイル名1] [wavファイル名2] [出力ファイル名]
```

つまり、2つのファイルを結合する場合は
```
$ sox input1.wav input2.wav output.wav
```

3つ以上のファイルを結合する場合は
```
$ sox input1.wav input2.wav input3.wav ... output.wav
```
となる。

以上是关于markdown 网络スクレイピングした内容を喋らせ,适切にファイル分割する的主要内容,如果未能解决你的问题,请参考以下文章

ruby スクレイピングのテストhttp://www.absolute-keitarou.net/blog/?p=634

python スポーツナビ竞马ページとnetkeiba.comから中央竞马データをスクレイピングする的Pythonスクリプト

python スポーツナビ竞马ページとnetkeiba.comから中央竞马データをスクレイピングする的Pythonスクリプト

swift Decodable触るの初めてなのけけれど,数据型じゃなくて字典型をマッピングしたい时って数据に一旦変换必要なのかな。もっとスマートにできそう

csharp 1文字ずつ表示する。タイピング音も鸣らす

csharp 出题文を一文字ずつ表示する。タイピング音も鸣らす。流用できそう