新しいサイトを追加¶

解析を行うサイトの新規追加を行うことができます。
URLとサイト名を入力して「追加」ボタンを押してください。

「高度な設定」については初期設定のままでもご利用いただけますし、サイトの特性などに応じて任意に変更いただいても構いません。
画面キャプチャのサイズ変更などを行うことが出来ます。

URL¶

解析対象のサイトのURLをhttpやhttpsから始まる形式で入力して下さい。
入力いただいたURLを起点として、クロールが開始されます。
なお、httpやhttpsを省略した場合には、httpにて補完されます。

またBasic認証が設定されたサイトでは、認証情報をURLに含む形式で登録・巡回が可能です。
（例: http://username:password@example.com/ ）

サイト名¶

Webサイトを識別するための任意の名称を設定してください。

※サイト名は登録後も変更可能です。

高度な設定¶

サイト解析にあたっての高度な設定を変更します。

クローラー設定¶

解析対象サイトの巡回時の設定を行います。

※この設定はサイト登録後に変更は出来ません。

../_images/screen-new-advance-crawlerSetting.png

上位階層の巡回¶

http://example.com/foo/bar/ のようにサブディレクトリを含むURLが指定された場合、デフォルトでは上位ディレクトリ（ http://example.com/ や http://example.com/foo/ ）は巡回しません。もし上位階層も巡回する場合は、この項目にチェックを入れてください。

最大深度¶

巡回を開始したページからの最大到達数を指定します。到達に必要な最短の画面遷移数がこれを超えるページは巡回対象から除外されます。

巡回リソース数上限¶

HTML、画像、PDFなど種別にかかわらず、ひとつのURLを1とカウントした場合の巡回上限です。これを超えた場合、サイト全体を巡回出来ていない状態でも巡回を完了し、ステータスが 巡回完了（上限到達） となります。

指定できる上限は契約プランによって異なります。

巡回HTML数上限¶

HTML（ Content-Type に html が含まれる）を1とカウントした場合の巡回上限です。これを超えた場合、サイト全体を巡回出来ていない状態でも巡回を完了し、ステータスが 巡回完了（上限到達） となります。

指定できる上限は契約プランによって異なります。

クエリー文字列¶

デフォルトでは、 http://www.example.com/index.php?uid=xxxx のようなURLは http://www.example.com/index.php として巡回します。 ? 以降のパラメータを保持したまま巡回する必要があれば、この項目のチェックを外してください。

robots.txt¶

この項目をチェックすると /robots.txt の内容を解析し巡回禁止定義されているコンテンツはクロールしないようになります。

巡回を許可するドメイン¶

ドメインが変わるリンク先や画像の読み込みはクロール対象外となりますが、「巡回を許可するドメイン」に定義されたドメインであればクロールの対象となります。

User Agent¶

クローラの User Agent を指定します。初期状態ではREMAPにアクセスしているブラウザのUser Agentが入力されています。

無視するパス¶

巡回時に無視するURLを定義します。正規表現を用いて定義し、URLに部分一致する場合はスキップしデータベースへの登録を行いません。

画面キャプチャ設定¶

画面キャプチャの設定を行います。

※この設定はサイト登録後に変更は出来ません。

../_images/screen-new-advance-captureSetting.png

キャプチャ¶

画面キャプチャの有効・無効を切り替えます。

画面キャプチャが不要の場合や、解析対象サイトへのアクセス数を減らしたい場合、巡回速度を上げたい場合は無効にして下さい。

レンダリング遅延¶

ブラウザレンダリングから画面キャプチャ作成までの待ち時間を設定します。フェードインで画面表示するサイト等に有効です。

画面サイズ一覧¶

生成したい画面キャプチャを複数登録出来ます。

Retinaディスプレイ対応としてPixcel Ratioが指定できますが、1以外の場合は指定した幅・高さのPixcel Ratioを乗算した値がmedia queryのwidth, heightとして認識されることに注意してください。

例えば、 幅: 320px, Pixcel Ratio: 2 で登録された場合、幅640pxとして認識されるため @media (max-width: 320px) の条件には一致しません。

画面サイズ設定例¶

用途	幅 (px)	高さ (px)	Pixel Ratio
PC	1280	1024	1
iPhone 4	320	480	2
iPhone 5	320	568	2
iPhone 6	375	667	2
iPad	768	1024	1

パーシャル設定¶

REMAPではHTMLの部分要素を パーシャル として定義します。
パーシャルはCSSセレクタや正規表現を用いてユーザが自由に定義し、マッチしたテキスト部分を取得します。
※この設定はクロール完了後にも自由に変更出来ます。

../_images/screen-new-advance-partialSetting.png

ラベル¶

パーシャルに任意の名前を設定します。このラベルはページの表示列として使用されます。

タイプ¶

CSSセレクタ か 正規表現 を選択します。

式¶

上記のタイプに応じた式を記述します。

ページ名設定¶

ページ名の取得方法を定義します。
ページ名はページ一覧やサイトマップ上でページを識別するための名称として用いられます。
title要素のテキストを区切り文字で区切って先頭や末尾を取得したり、パンくずナビゲーションの末尾部分などから取得すると良いでしょう。
※この設定はクロール完了後にも自由に変更出来ます。

../_images/screen-new-advance-renewalSetting.png

タイプ¶

CSSセレクタ か 正規表現 を選択します。

式¶

上記のタイプに応じた式を記述します。

設定例¶

初期設定では下記のように定義されています。

タイプ	式
CSSセレクタ	`title`
正規表現	`?[｜\\|].*$` → `（空）`

この場合、title要素のテキストノードを取得し、パイプ区切り（ | や ｜ ）で区切られた文字の先頭部分を取得することを意味します。

ページ名 | カテゴリ2 | カテゴリ1 | サイト名称 というtitleがあれば、 ページ名 の部分のみが抽出されます。