MissingLinkプラグインヘルプ | [ダウンロード] |
---|---|
+-------------------------------------------------------------------------+ | − INCM用Plug-in : MissingLink系掲示板用 − | | | | Ver0.21 2003/06/11 by GETWILD'74 | +-------------------------------------------------------------------------+ はじめにGAEさん作、Web掲示板巡回ツール INCM(http://www.kaede.sakura.ne.jp/~nikeno/incm/)の、MissingLink系掲示板用Plug-inです。 INCM本体下のPluginsフォルダに置くだけで、BBSフォルダのプロパティで選択/使用可能になります。 ※別途INCM_MODULEセットが必要です。 フォルダプロパティ最初の巡回時はURLだけを入れればBBSの種類を自動認識するようになっています。巡回ページ数最初は空欄で、この場合は1ページ分の記事を読みます。2ページ目以降を読む場合はページ数を半角数値で入力します。 詳細設定の掲示板の種類を記入することで、強引に巡回することも可能です。マーク(Lindenbaum)指定したいマークの番号を記入して下さい。フォーム上の各種設定(クッキー保存など)ラジオボタンのいずれかを選択、またはチェックをして下さい。デフォルトでは無効や無しに設定されます。 正規表現カスタマイズされたKENT WEB系BBSでもデフォルトの定義を置き換えることで巡回できるようになる可能性があります。プラグイン改造のようにPerlを理解する必要はありません。 子記事に関する設定は親と子が違う場合に設定して下さい。 記事全般記事ヘッダと本文の区切り区切りとなる文字または正規表現を記入。記事と判断する部分記事情報の定義名を記入、一致すれば記事とみなします。Num:記事番号 ResNum:レス元記事番号 Title:題名 Name:投稿者名 Date:日付 Url:サイト Mail:メール Comment:本文 Attachment:添付ファイル 無条件に記事とする正規表現この正規表現に一致すれば記事とみなします。書式(記事情報)Value=>正規表現,Match=>何番目の()を抽出するか,No=>定義中の何番目に調べるか,Opt=>オプション,SetParse=>1(必要がなければ記入しない)※UrlとMailと日付の場合はValueにAUTOと記入すると自動判定します。 書式(日付書式)Y:年 M:月 D:日 H:時 m:分上記の記号の次に記載順の番号を付けます 01/01 2000 00:00 ならば M1/D2 Y3 H4:m5 日付定義を指定する場合はEasyオプションが必要になります。 Value=>M1/D2 Y3 H4:m5,Opt=>Easy 正規表現(Value)面倒かもしれませんが正規表現については各自で調べて下さい。Perlを勉強するのに比べれば難しいことではないですし、知っておいても損はないです。 何番目の()を抽出するか(Match)正規表現を勉強すれば分かることなんですが、正規表現中で「()」で囲まれた部分を後で取り出すことができます。それを使って投稿者名などを得るわけです。 ただ単に数値を指定して下さい。 定義中の何番目に調べるか(No)これはプラグインの定義を見ないと分からない部分です。通常、調べて一致した部分は削除されてしまうようになっているので、何から抽出するかの優先順位です。 プラグインの定義部分を見るのが早いのですが、参考値を記載しておきます。 分からない場合は指定しなくてもエラーにはなりません。 種類 指定値 記事番号 1 レス元番号 2 投稿者名 2 or 3 題名 2 or 3 or 4 本文 4 or 5 オプション(Opt)抽出の仕方に関するオプションです。複数指定の場合は単に繋げて記述して下さい。 m : 一致後に一致した部分をそのまま残す i : 大文字小文字を区別しない ツリー解析の結果を参照(SetParse)記事からは得られない情報をツリー解析で取得し、記事解析の結果とします。例えばツリー番号など。 設定例(記事情報)記事番号No: Value=><font [^>]+>No\.(\d+),Match=>1,No=>2 上の設定は No: <font color="#0000FF">No.123 というHTMLから記事番号を抽出するものです。 正規表現のその他の詳細設定ツリー解析、記事の読込定義はオプション等は必要ありません。HTMLタグをそのまま記述しても構いません。 ただし、ツリー解析の記事判定に関しては決まり事があります。 URL引数(?以降)と記事番号を「()」で括るということです。 URLが一番目、記事番号が二番目になるようにして下さい。 子記事判定の場合はURLは必要なく、記事番号のみを括って下さい。 スレッド解析親記事判定掲示板がスレッドタイプの場合に処理中の記事が親記事かどうか判定します。記事中に含まれるHTMLに親記事独自のものを見つけ正規表現で指定します。 記事の切り分け単純な記事の区切り定義だけではスレッドの記事を区切れない場合に指定します。Parent: 親記事と子記事の区切り Child : 子記事間の区切り 例 : Parent=><hr,Child=>\n ツリー解析記事のURLリスト記事へのリンクを取得する定義です、記述は記事情報と同じです。URLリストの取出方法取得したリンクは得られた順番に格納されます。それを取り出してアクセスする時の取り出し方を指定します。 頭から取り出す場合は「Shift」と記入します。 末尾から取り出す場合は無指定です。 その他の定義記事番号、レス元記事番号は記事情報と同じです。記事区切り等は記事の読込定義と同じです。 記事の読込定義記事の区切り記事を読み込む際の記事毎の区切り文字列を指定します。ページ頭読み飛ばし記事より前の部分を読み飛ばす際に指定します。ページ末尾読み飛ばし記事より後の部分を読み飛ばす際に指定します。ページめくりページめくりに必要な情報を取得するための定義です。Found: 次のページを示す部分を指定します。 Type : フォームボタン(Form)か、リンク(Anchor)かを指定します。 Match: TypeがAnchorの時にパラメータを取得するのに指定します。 Step : TypeがFormの時にフォームの区切りを指定します。 例(Form) : Found=>value="次の\d+件">,Type=>Form,Step=></form> 例(Anchor): Found=><a href="[^\?]+\?(page=\d+)">,Type=>Anchor,Match=>1 フレームの引数掲示板がフレームになっている場合に記事表示のCGI引数を指定します。例: mode=log CGIモードの引数アクセスする際に特定のCGI引数が必要な場合に指定します。デバッグ用設定動作ログを保存するプラグイン実行時の動作を記録します。どうしても問題が解決しない場合に、このログをプラグイン作者が見て解決出来るかもしれません。 問題点自動認識および解析処理は最近のバージョンしか試してないので、古いバージョンでは巡回できないかもしれません。(^^;オリジナルであれば古いバージョンも対応しますのでお知らせ下さい。Narration BBSの書き込みに対応していません。更新履歴Ver0.01 2003/04/03 :LindenbaumVer1.0と1.1の読み込みに対応Ver0.02〜0.03 2003/04/15 :ページめくりの初期設定を追加(処理自体は未対応)Url取得に関する設定を追加 Ver0.04〜0.10 2003/04/20 :モジュールの大幅な変更に伴う修正複数ページ巡回に対応 Ver0.11〜0.20 2003/06/09 :Lindenbaumの書き込みに対応Narration BBSの読み込みに対応 Ver0.21 2003/06/11 :Lindenbaumのマーク取得定義を削除終わりにより多くのMissingLink系掲示板に対応できれば良いと思っています。 当面はレンタルや改造以外のものを中心にします。 このスクリプトの著作権は一応保持します。 個人利用または無償配布に限り、このスクリプトの改造を許可します。 有償ソフトウェアでのこのスクリプトの利用を禁止します。 INCM以外での利用に関しては動作確認していませんし、バグ等のサポートもしません。 http://www3.wind.ne.jp/getwild/incm/InfoCgi/ e-mail:getwild@mail.wind.ne.jp GETWILD'74 |
|
MissingLinkプラグインヘルプ | [ダウンロード] |
- Plugin Infomation - Ver 1.34 | Produced by GETWILD'74 |