
今回は日頃Skypeでお話させていただいてる方にご紹介いただいたものです。
ざっくりというと
「コンテンツを作る時に他の人が作った刺さる名言を利用しよう」
というものです。
物販アフィリよりもAdSense寄りの作り方で
記事コンテンツの中に「名言」もしくはそれっぽいものを入れる
ってのは私は結構やってまして
そのことを話していたら
twitterにうようよいるbotから名言を抜き出しデータベース化する方法
を考えていただきましたので紹介します。
ひとつのアカウントのつぶやきを抜き出して
テキストに落とす
という単純なものですがかなり便利です。
「失敗は成功のもと」
と書くより
「私は失敗したことがない。 ただ、1万通りの、 うまく行かない方法を 見つけただけだ。by エジソン」
って書くほうがあきらかに説得力が上がりますからね。
音無しの30秒ほどのダイジェスト動画
この記事の流れ
名言をコンテンツの一部として活用するメリット
名言を利用することで1番違いが出るのが説得力が増すということ
そして、中立の立場が取れる。
「その人が書いてしまうと不快な思いをさせてしまう内容でもあくまで第三者(しかも偉人)の意見というスタンスが取れる」
というのもメリットです。
よくテレビ通販で第三者の意見として商品の感想を扱っていますが
スタンスはあれと同じです。
「思うだけで痩せたらデブは存在しないよね。実行しようよ」by管理人
だと
「なにこいつ、上から目線で偉そうに」と
アホみたいに非難コメントがきそうですが
「思うだけで痩せたらデブは存在しないよね。実行しようよ」叶姉妹
だと
本人からのメッセージではないので避難はされません。
ココも素晴らしいとこ
とまあこんなな感じでSkypeで盛り上がってたら
詳細なやり方を送っていただきました。
このあいだ名言を利用するというお話聞かせて頂いた件で。
とりあえずダイエットと美容のデータベースを作りました。
一応30分〜1時間くらいで1000〜2000個くらい集められる手順を考えました。
もしご関心があれば、あしたにでも手順のメモをお送りします。
これどこかで公開してますか?めっちゃありがたいです。
ぼくも公開してないです。
※原文そのまま
ということで送られてきたものを公開。
【名言のデータベースを効率良く作る】大まかな流れ
1.名言の収集
- twimemachineでユーザー検索&ツイート一斉コピー
- ↑を対象ユーザー分くりかえす
- メモ帳エディタに貼り付け(同じファイル)
2.重複の削除
- 貼りつけたデータから「正規表現」を使って余計な文字列を削除
- 重複している文字列を抽出してマージする
3.Evernoteに保存(おまけ)
- できたテキストを全コピー
- タイトルを工夫してEvernoteに貼り付け
いつものごとく超適当に撮った動画
名言データベースを作る細かい手順
1.名言の収集⇒twimemachineで根こそぎ拾う
1-1,twimemachineと自分のtwitterアカウントをコネクト
twimemachineでユーザー検索&ツイート一斉コピー
※自分のアカウントでログインする必要があります。Twitterのアカウントを持っていない人は作ってください。
↑ここのチェックは外します。
メイン画面に入ると、左側に以下のような画面が出てきます。
ふたつ、テキスト入力ボックスがありますが、上は使いません。
下のボックスを利用します。(@とChange userの間)
下側のボックスに、ツイートを採取したいアカウントを入力します。
1-2,twitterにてツイートを取得したいアカウントを検索
Twitterの公式画面をもう1つ開いておいて、そこで検索
twitter上にて
今回は「美容 名言」と検索します。
こういう名言botがたくさん出てきます。
1-3,twimemachineで出てきたものを全コピー
この@以下のアカウント名を、先ほどの検索ボックスに入力します(コピペ)
そして、「Change user」をクリック。
この際、コピーしたアカウント名の最後に「半角スペース」が入ってしまうとうまくいかないので注意。
すると右側に以下のように、ドッと出てきます。
最大で直近3200ツイートをロードできます。
1画面になるので、コピペの手間はありません。
最初の1文字目から適当にマウスでドラッグ(文字反転)させたら、
これでツイートだけすべて選択→コピーできます。
(ctrl + A だと、左側まで選択してしまいます。注意)
これをコピペして、いったんメモ帳エディタに貼り付けます。
この作業をいくつかの、アカウントで繰り返す。(5~10も取得すれば十分)
以上で収集終わりです。
2.重複の削除【サクラエディタでのやり方】
が「秀丸」や「MK editor」など正規表現が使えるエディタだとなんでも大丈夫なはずです。
ただし、若干操作コマンドは変わると思うのでそのあたりはググって調べてください。
また、メモ帳やワードパッドなど正規表現が使えないエディタは無理です。
botなので、同じつぶやきが繰り返し出てきます。
なので、サクラエディタを使って、重複を削除します。
2-1,ツイート日時やURL文字列を削除【正規表現】
しかし、面倒なことに、Twimemachineは、ツイート日時まで付けてくれています。
ただの名言だけのデータを作るならこれを削除する必要があります。
例:
大切なものは失って初めて分かると言うが、本当に分かるのは、それがまた戻ってきたときなのかもしれない。 https://t.co/HZN4P19WCO Mon May 16 09:42:01 +0000 2016
↓
大切なものは失って初めて分かると言うが、本当に分かるのは、それがまた戻ってきたときなのかもしれない。
こうしたい。
よく見ると後ろの文字列には法則があるのがわかります。
- URLリンクがついているもの(http~)
- リンクがなくただ日付が入っているもの(Mon Tueなど)
- ハッシュタグが含まれているもの
- RTされたツイートが表示されている(基本いらない)
なので下記の正規表現を駆使して
この文字列を順番に削除していきます。
(下記の正規表現をコピーするだけで使えます)
- http.*
- Mon.*
- Tue.*
- Wed.*
- Thu.*
- Fri.*
- Sat.*
- Sun.*
- #.*
- RT @.*
サクラエディタ上で
Control+R
をクリックして「置き換えメニュー」から一つずつ入力していきます。
「正規表現を使う」にCHECKを入れるのを忘れずに
後ろに付いているよく分からない「.* 」は
=この後に続く文字列はなんでもいいので全部消して!
という意味です。
冒頭の適当動画では
この手順を記録させてマクロにして一気にやってますが
まあ、1つずつやっても3分くらいで終わります。
これで余計な文字列が消えてスッキリしました。
2-2,SAKURAエディタで重複行削除
文字列は消えましたが
基本「botのツイート」なので重複が目立ちます。
セットしたデータを1時間に一回とか流しているだけなので
これを削る必要があります。
botのアカウントにもよりますが
例えば1000ツイートコピーしても
重複を削除すると70くらいになってしまうものや
600くらいにしかならないものなど結構バラバラです。
手順は簡単で
ALT + A ソート
ALT + M マージ
たった3ステップだけです。
もちろん表計算ソフトでもできるのですが
Excelだと重複の削除の場合
「貼りつけ+フィルタ」の手順が必要で
しかも何千行のデータに対して
この作業をやろうとするとかなり重くなります。
Googleスプレッドシートなどは重すぎて論外。
openofficeやLibreも試したけど
行数が3000とか超えると
まともに言うことを聞いてくれません。(一応Core-i5)
なので小さいノートではまずまともな操作ができません。
サクラエディタを使うほうが楽かな・・・と思います。
以上で「重複の削除」終わりです。
ジャンルにもよりますが、この作業でエディタに1000行くらい・4~5万文字は、収集できているのではと思います。
※補足
上の画像でもまだ重複しているものがありますが、これは「改行コード」が違うせいで全く同じ文章でも別物だとみなしてしまっているのが原因。
この場合はまた正規表現で「¥n」⇒「¥r」に改行コードを変換してあげると上手くマージできます。たぶん
3.Evernoteに保存(おまけ)
あとは適当に保存しましょう。
おすすめはEvernoteですね。
「名言なんちゃら」みたいなノートブックを作って
「美容 名言 @アカウント名」
とか
「ダイエット 名言 2000」
などのタイトルを付けておくと
管理しやすいかと思います。
以上でEvernoteに保存終わりです。
おわりに
この手順ですが、収集や重複削除に慣れてしまえば
30分前後で1000行~2000行ほどは集められます。
なので、一応方法を共有させて頂ければと思いました。
何かのお役に立てれば幸いです。
以上です。
Mさん、ありがとうございました。
写真付きでEvernoteに送っていただき本当に感謝しています。
このブログの記事でも
「アフィリエイトは間違った方法でやるといくら時間を透過しても稼げない」
っていうのを伝えるために
マイケル・ジョーダンの
「何事も正しい方法と間違った方法がある。間違ったやり方でシュートを打ってもそれは間違ったシュートの名人になるだけだ」
っていれただけでかなりの反響がありましたからね。
名言はジャイアンに寄り添うスネ夫方式でそのコンテンツに説得力を持たせるのにかなり効果があります。
こうして集めた名言は色々な使い方ができます。
外注さんとかにも見せてあげるのも良いと思います。
コンテンツの最後に入れてアクセントにしたり
名言から記事を考えたり
名言を参考にして自分なりの名言を作ってみたり
と記事ネタに困らなくなると思いますので
ぜひ、提供いただいた方法で自分なりのデータベースを作ってみてください。
今回は「名言」でしたが発想次第ではいろいろな用途に使えそうです。
名言抜き出しマニュアル?!ありがとうございます。
何となく、こんな方法ないかなーと探していて見つけました。
メールマガジンにも登録させていただきました
【Yahoo!知恵袋】での調査を自動化するマクロ
めちゃくくちゃ魅力的です!
今回、初めて知ったので、記事でいろいろと勉強させていただきます。