機能と特長

機能と特長


マニュアル

はじめに

このプラグインはMarkove Rewrite Summarizer(マルコフリライトサマライザー)と呼びます。
Markove Rewrite Summarizerは阿修羅ワークス代表長岡が開発したオリジナルのワードプレス向けプラグインです。

リライトテスト

最初にリライトをテストしてみましょう。

[ リライトテスト ] をクリックしてリライトテスト画面を出します。この画面は単独で使えるテストツールですのでなにをやっても大丈夫です。

原稿になにかしら文章をセットします。例としてヤフーニュースにあった原発関連のニュースを使ってみます。

原文( 634 )文字です。

原発事故を巡る同様の集団訴訟は全国で約30あり、福島地裁での判決は前橋、千葉の両地裁に続き3例目。
福島訴訟では、国の避難指示が出た区域の原告は約1割。大半は福島県内の避難指示が出なかった地域の住民で、宮城や茨城、栃木の住民もいる。

原告は「原発事故前の暮らしを取り戻したい」として、居住地の空間放射線量を事故前の水準とする毎時0・04マイクロシーベルト以下に引き下げる「原状回復」を要求。実現するまで、毎月5万円の慰謝料を求めた。

また、原告の一部は原発事故で仕事や人間関係を失ったとして、1人2千万円の「ふるさと喪失」慰謝料も求めた。

これに対し、国や東電は放射線量を引き下げる具体的な方法が不明確で、金銭的にも不可能などと反論。賠償も国の基準の中間指針に基づいて支払った金額で十分だとしていた。

原発事故に対する国と東電の責任については、原告は地震調査研究推進本部が公表した「長期評価」などを根拠に、国側は原発の敷地高さを超える津波を予測できたと主張。国側は長期評価には様々な反論があったとして、「科学的根拠に乏しい」と反論した。

今年3月に最初に判決が言い渡された前橋地裁は、国と東電についてともに津波を予見できたと指摘。対策を怠ったと認め、計3855万円の支払いを命じた。

一方、9月の千葉地裁は国の賠償方針を上回る支払いを命じたが、国の責任は否定。東電についても重大な過失があったとは認めなかった。

これをリライトするとこうなります。

( 481 )文字

原発事故を巡る同様の集団訴訟は全国で約30あり、福島地裁での判決は前橋、千葉の両地裁に続き3例目。福島訴訟では、国の避難指示が出なかった地域の住民もいる。原告は「原発事故前の暮らしを取り戻したい」として、居住地の空間放射線量を事故前の水準とする毎時0・04マイクロシーベルト以下に引き下げる「原状回復」を要求。

実現するまで、毎月5万円の慰謝料も求めた。これに対し、国や東電は放射線量を引き下げる具体的な方法が不明確で、金銭的にも不可能などと反論。

賠償も国の基準の中間指針に基づいて支払った金額で十分だとしていた。原発事故に対する国と東電の責任については、原告は地震調査研究推進本部が公表した「長期評価」などを根拠に、国側は原発の敷地高さを超える津波を予測できたと主張。

東電についても重大な過失があったとは認めなかった。

634文字から481文字へとダイエットされています。
ランダム生成なので毎回若干変わりますが、必ず原文よりも短くなることがわかります。
また、記号や絵文字などを含んだ文章の場合はうまくいかない場合があります。予めリライトに関係のない文字については消去してから試して下さい。
また原文が文法的におかしい場合は、それが修正されることはありません。おかしいままです。ご了承下さい。
ニュースサイトの文章のような比較的曲のない文章はうまくいきやすいです。

上記をさらに短くしたい場合は設定を変更します。

をクリックして設定画面を出します。

[ 書き換え設定 ] タブをクリックして、「より文章を省略する」を「する」にするとより短くできます。
短くした結果が下記です。

( 184 )文字

原発事故を巡る同様の集団訴訟は全国で約30あり、福島地裁での判決は前橋、千葉の両地裁に続き3例目。
実現するまで、毎月5万円の慰謝料を求めた。
賠償も国の基準の中間指針に基づいて支払った金額で十分だとしていた。
今年3月に最初に判決が言い渡された前橋地裁は、国の責任は否定。
東電についても重大な過失があったとは認めなかった。

必要に応じて設定を変更して下さい。
必ず変更は [ 変更を保存] ボタンを押して保存してください。

応用編

次に応用ですが、リライトする文章はあくまでも要約されるだけで文意が広がったり、文脈が再解釈されることはありません。
あくまでも短く言い換えただけとなります。そこで、類似のニュースソースを用意して、複数の文章から合成リライトしたらどうなるでしょうか?
※複数の文章を繋ぎ合わせる方法はショートコードを使います。ショートコードについては別章で解説します。

読売新聞、日本経済新聞、朝日新聞の三誌を以下のように用意しました。

【読売新聞】

 東京電力福島第一原発事故を巡り、福島県在住者ら3824人が国と東電に損害賠償などを求めた集団訴訟で、福島地裁(金沢秀樹裁判長)は10日、国と東電の責任を認め、賠償を命じる判決を言い渡した。  同種の集団訴訟の判決は、前橋、千葉訴訟に続き3例目。前橋判決は国の責任を認めたが、千葉判決では認められず、福島地裁の判断に注目が集まっていた。

【日本経済新聞】

 福島第1原子力発電所事故後に福島県から群馬県に避難した住民ら137人が国と東京電力に1人あたり1100万円(総額約15億円)の損害賠償を求めた集団訴訟の判決が17日、前橋地裁であった。原道子裁判長は請求の一部を認め、国と東電に賠償を命じた。「国は津波の到達を予見できた。国が事故を防げなかったのは違法」として国の責任を認めた。  全国20の地裁・支部で避難者ら計約1万2千人が起こしている集団訴訟で最初の判決となった。原発事故をめぐり国の賠償責任を認めたのは初めて。  今回の訴訟では、東電や国が津波を予見し、対策を取ることができたかどうかや、国の指針に基づく東電から避難者への賠償額の妥当性が主な争点となった。

【朝日新聞】

 東京電力福島第一原発事故でふるさとの生活が奪われたとして、福島県の住民ら約3800人が国と東電に生活環境の回復や慰謝料など総額約160億円の賠償を求めた訴訟で、福島地裁(金沢秀樹裁判長)は10日、国の責任を認め、国と東電に賠償を命じる判決を言い渡した。生活環境の回復を求める訴えは却下した。 【写真】国と東京電力に倍賞を命じる判決内容を速報する原告団の弁護士=10日午後2時11分、福島地裁、林敏行撮影  原発事故を巡る同様の集団訴訟は全国で約30あり、福島地裁での判決は前橋、千葉の両地裁に続き3例目。  福島訴訟では、国の避難指示が出た区域の原告は約1割。大半は福島県内の避難指示が出なかった地域の住民で、宮城や茨城、栃木の住民もいる。  原告は「原発事故前の暮らしを取り戻したい」として、居住地の空間放射線量を事故前の水準とする毎時0・04マイクロシーベルト以下に引き下げる「原状回復」を要求。実現するまで、毎月5万円の慰謝料を求めた。  また、原告の一部は原発事故で仕事や人間関係を失ったとして、1人2千万円の「ふるさと喪失」慰謝料も求めた。  これに対し、国や東電は放射線量を引き下げる具体的な方法が不明確で、金銭的にも不可能などと反論。賠償も国の基準の中間指針に基づいて支払った金額で十分だとしていた。  原発事故に対する国と東電の責任については、原告は地震調査研究推進本部が公表した「長期評価」などを根拠に、国側は原発の敷地高さを超える津波を予測できたと主張。国側は長期評価には様々な反論があったとして、「科学的根拠に乏しい」と反論した。  今年3月に最初に判決が言い渡された前橋地裁は、国と東電についてともに津波を予見できたと指摘。対策を怠ったと認め、計3855万円の支払いを命じた。  一方、9月の千葉地裁は国の賠償方針を上回る支払いを命じたが、国の責任は否定。東電についても重大な過失があったとは認めなかった。

これをリライトした結果が以下です。リライト結果 ( 415 )文字

東京電力福島第一原発事故を巡り、福島県在住者ら3824人が国と東電に損害賠償などを求めた集団訴訟の判決が17日、前橋地裁であった。
原道子裁判長は請求の一部を認めた。
全国20の地裁・支部で避難者ら計約1万2千人が起こしている集団訴訟で最初の判決となった。原発事故をめぐり国の賠償責任を認めたのは初めて。
福島訴訟では、国の避難指示が出た区域の原告は約1割。
実現するまで、毎月5万円の慰謝料を求めた。これに対し、国や東電は放射線量を引き下げる具体的な方法が不明確で、金銭的にも不可能などと反論。
賠償も国の基準の中間指針に基づいて支払った金額で十分だとしていた。原発事故に対する国と東電の責任については、原告は地震調査研究推進本部が公表した「長期評価」などを根拠に、国側は原発の敷地高さを超える津波を予測できたと主張。
東電についても重大な過失があったとは認めなかった。

ご覧の通り自然に要約しつつオリジナリティの高い文章を合成することができました。

文章合成のコツ

複数のソースから文章を合成するコツですが、文章を序文・本文・結論に分けることです。文章は大抵この3つのパートに分けることが出来ます。
例えば3つのソースがあったら、1つ目は序文部分だけをコピーし、2つ目は本文だけをコピーし、3つ目は結論だけをコピーして合成すればより自然な文章の流れが再現できます。

似たような文章の似たようなことを使ってしまうと、要約しても同じことの繰り返しとなって不自然となるので、パートを分けた方がベターです。

さらなる応用

さらなる応用として、ところどころにその文章に対するコメントを挟むとよりオリジナリティが高まります。
つまり、SEO的にもコピーコンテンツとみなされ難くなります。

コメントについては自分で書いてもいいですし、Twitterから持ってきてもいいでしょう。
Twitterから持ってくる場合は専用のプラグインを使うと効果的です。

拙作のオリジナルワードプレスプラグイン「Gwtwin」を使うと簡単に関連ツイートを差し込むことが出来ます。

Markove Rewrite Summarizerを設定する
書き換え設定

書き換えの設定をします。
ここでは投稿された記事の書き換え設定を行います。

上級書き換え設定

上級書き換えは応用的な要約の設定をします。

動的一時表示設定

動的一時表示設定は投稿データを書き換えずに都度そのページが表示された際にリライトをするための設定です。
ロボット型検索エンジンの巡回の際にだけリライトさせることもできます。

ショートコード設定

ショートコードの設定です。特にいじることはありません。
ショートコードは以下のような書式となっています。投稿本文で使用するとその部分をリライトできます。

文字列。<br>

各パラメータの意味は以下の通りです(省略すると書き換え設定の設定が有線されます)。
row……マルコフ連鎖で使用するセンテンス数(通常は3を指定します。)
delimiter……文を分ける区切り文字列(通常は読点の「。」を指定します。)
pre……文の始めに付ける文字列
end……文の終わりに付ける文字列

スケジュール設定

スケジュール設定はwp-cronの機能を使った定期実行スケジュールを設定できます。
ワードプレスの疑似cronはワードプレスにアクセスされた時に起動します。よって、アクセスがまったくない状態ではスケジュールが機能しないのでご注意下さい。

スケジュールを有効にする

スケジュールはまだリライトされていない投稿記事があれば、定期的に自動的にリライトをさせるための設定です。
スケジュールは誤作動防止のため初期設定では「無効」となっています。使用する場合は「有効」にしてください。

スケジュール間隔

スケジュール間隔は自動リライトを行う間隔を指定します。例えば1時間に1回であれば1日に24回定期スケジュールを指定実行します。

環境設定

環境設定は基本的にはいじりませんが、プラグインの動作環境を設定できます。

ショートコードの使い方

Markove Rewrite Summarizerはショートコードが使えます。

文字列。<br>

各パラメータの意味は以下の通りです(省略すると書き換え設定の設定が有線されます)。
row……マルコフ連鎖で使用するセンテンス数(通常は3を指定します。)
delimiter……文を分ける区切り文字列(通常は読点の「。」を指定します。)
pre……文の始めに付ける文字列
end……文の終わりに付ける文字列

使用例1

記事本文に以下のように記述します。

徐々に全身の筋肉が衰える難病に侵され、体の自由や言葉を失いながらも宇宙創成の謎に挑み続けた「車いすの天才物理学者」、スティーブン・ホーキング博士(76)が死去した。
使用例2

複数のショートコードを使って組み合わせることが出来ます。

徐々に全身の筋肉が衰える難病に侵され、体の自由や言葉を失いながらも宇宙創成の謎に挑み続けた「車いすの天才物理学者」、スティーブン・ホーキング博士(76)が死去した。
使用例3

複数のショートコードを使って、ショートコードの合間に自分のコメントを挟むことが出来ます。

徐々に全身の筋肉が衰える難病に侵され、体の自由や言葉を失いながらも宇宙創成の謎に挑み続けた「車いすの天才物理学者」、スティーブン・ホーキング博士(76)が死去した。

自分のコメント。ホーキング博士よありがとう!

使用例4

ショートコードを記事以外で呼び出したい場合は「do_shortcode()」関数を使います。

例えばテンプレート呼び出したい場合は以下のようにします。

<?php echo do_shortcode( '文字列。
' ); ?>

例えばサイドバーウィジェットから呼び出したい場合は以下のようにします。

do_shortcode( '文字列。
' )

ワードプレス サイドバーでショートコードを使う方法

過去記事の一括処理

Markove Rewrite Summarizerはショートコードを使わずに過去記事を要約リライト可能です。
必ずバックアップまたはテストサイトでテストしてから実行して下さい。

一度書き換えが実行されると投稿のカスタムフィールドに「markove」というキーが追加され、二度目からはスキップされます。
再度実行する場合は、カスタムフィールドのキー「markove」を削除する必要があります。

書き換える投稿の条件を指定する

過去記事を書き換える記事の条件を指定できます。
初期設定では「投稿タイプ」の公開された記事が対象となります。

セレクタを指定する

初期設定では「書き換え設定」で指定された条件で本文を全て要約リライトします。
もし、本文を全てを要約せずに指定した部分だけを要約リライトする場合はセレクタを指定します。

[ 上級書き換え設定 ] を開きます。

「記事内でスクレイピングするセレクタ」に「セレクタ」を指定します。
セレクタというのはCSSのセレクタを意味します。もし意味がよく分からない場合は「#mrs」と入力しておいてください。
「#mrs」はMarkove Rewrite Summarizerの略称です。

記事の本文に指定のセレクタがある場合にだけ書き換えの対象となります。
例えば記事の本文が以下のようであれば

こんにちは
さようなら
またきてね

以下のようにします。

<div id="#mrs">こんにちは
さようなら
またきてね</div>

「<div id="#mrs">」~「</div>」にはさまれた文字列が書き換え対象となります。それ以外は書き換えされません。

一度に処理する件数を指定する

過去記事を一度に処理する件数を指定できます。

[ 上級書き換え設定 ] を開きます。

「最大記事処理数」と「投稿を一度に処理する件数」を指定します。

「最大記事処理数」は初期設定では3件となっています。3件ずつリライト処理するという意味です。
例えば1000件の投稿があれば334回に分けて処理されます。この数値を多くし過ぎるとWordPressに負荷がかかる可能性があります。

「投稿を一度に処理する件数」は初期設定では100件となっています。100件ずつ検索して複数回に分けて検索処理するという意味です。
例えば1000件の投稿があれば10回に分けて検索されます。この数値を多くし過ぎるとWordPressに負荷がかかる可能性があります。

「最大記事処理数」と「投稿を一度に処理する件数」の関係は、「最大記事処理数」が実際のリライト処理で「投稿を一度に処理する件数」と比較して数十倍処理が重くなります。
長文の場合はメモリが足りずに処理が停止し誤作動を起こす場合があります。
できれば数値はいじらないください。スケジュールで定期的に自動処理されます。

スケジュールを有効にする

過去記事を一度に処理するスケジュールを有効にします。

[ スケジュール設定 ] を開きます。

「スケジュールを有効にするか」を「する」にすると「書き換え設定」と「上級書き換え設定」の内容に応じて、書き換えが指定スケジュール間隔で順次処理されます。