05.ライティング=テキストマイニングは儲かる!? でもネタはどうやって見つけるの?

05.ライティング=テキストマイニングは儲かる!? でもネタはどうやって見つけるの?


阿修羅ワークス
阿修羅ワークス
人間には0から1を作り出すのが得意な人と、1から99を作り出すのが得意な人というのがいます。
0から1を作り出せる人って自頭が良いんだろうなって思います。
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
この100年間、特にここ最近の20年間で人間の知能指数は物凄く上昇しています。
どうしてなんですか?
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
どうしてかというかというと、高い壁を超えるのに既にハシゴやエレベーターが設置されているからです。
アインシュタインは「巨人の肩に乗っている」と表現したといいます。
先人たちの知恵が残っているお陰で新しいことを考えることができるんですね。
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
0から1を作り出すのは相当な努力が必要です。そもそもなにもないのですから。
しかし、たとえたった1でも「こういうことができる」と可能性を示唆されていれば、努力次第でそれを99にすることは可能です。
この違いは物凄く大きいんですね。
よく言いますよね。初めてウニを食べた人はエライ! って(笑)
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
まぁ、そうです。そういうことです。
本題に戻りますが、ライティングが不得意な人もリライティングであればスルスル書ける場合って多いんですね。
リライティングですか?
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
例えば、論文を書くのは難しいですが、文章を正しい順番に並び替えるという問題は読解力があれば誰でも解くことができますよね。
はい。
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
それと同じように、ある程度下地といいますか、テンプレート(雛形)が決まっていれば、それを並び替えたり、アレンジしたりすることは優しいということなんです。
穴埋め問題やマークシートなら得意です!
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
プロであれば0から1、1から10000のような独創性や生産性を求められるかもしれません
検索エンジンに載せることが目的であるならば、前述したように美文である必要はないので、淡々と出来事や事実を記述するだけでもいいのです。
なんだか私にもできるような気がしてきました。
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
ただし、問題もあります。
それはコピーコンテンツ ペナルティです。
コピーコンテンツ ペナルティってなんですか?
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
表現は色々とあってもいいはずなんですが、検索エンジン的には全くの同一文章はアウトなんですね。
それがコピーコンテンツ ペナルティです。
まるで作文をチェックする先生みたいですね。
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
はい。
検索エンジンは美文かどうか、アート性が高いかどうかまでは理解できない代わりに、単純にその文章がほぼ同一かどうかの判定はできるんです。
さすが頭の良い検索エンジンですね。
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
つまり、どこかのサイトからパクってきてそのまま自サイトに掲載したら、複製だらけになってしまいますよね。
ウェブサイトは検索エンジンにとっては広告媒体ですから、広告媒体の質が下がるというのはなんとしても避けたいわけです。
そこでコピーコンテンツ ペナルティというわけですね?
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
そうです。
誰が見ても分かるレベルでコピペしたコンテンツというのはさすがに検索エンジンも評価しないわけです。
でもそれってオリジナリティを求められるわけだから、段々と書くネタがなくなっていきますよね。
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
そうなんです。
もう1つ問題があって、コピーコンテンツ ペナルティをとるということは、逆に言うとオリジナルコンテンツ以外は認めないと言っているわけで、将来的にはあらゆる組合せの文章においてペナルティが発生することになります。
あらっ……。
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
ペナルティといっても困るのは検索エンジン広告で食べようとしている人か、検索エンジンの検索結果の順位によって優位性を保ちたい人だけなので、直ちに全ての人が対象ではありません。
あっそういうことなんですね。
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
しかし、少なくともテキストマイニングを目指す人であれば死活問題と言えるでしょう。
いくら美文でなくてもいいとして、でも、オリジナルコンテンツとなると書くネタがないです。
ランファ
ランファ


阿修羅ワークス
阿修羅ワークス
そうでしょうね。
だから過去のことについては既にテキストが発掘され尽くされていることを考えると、新たな鉱脈、つまり最新情報や最新事実というものが「山」となります。

というと?
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
過去は採り尽くされても、未来においては鉱脈が新規に発生するんですね。
そこが現実世界の石油や鉱物資源開発とは異なるところなんです。
なるほど!
ニュースであればまだあまり知られていないわけですね。
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
ニュースはテキストマイナーにとってお宝の山です。
しかし、そこには当然、著作権の問題があるんです。
著作権の問題って絶対解決できませんよね?
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
いいえ、絶対とは言い切れません。