# 页面组管理

页面组是具有共同结构特征的页面集合，如商品详情页、新闻资讯页；可用于基础指标分析或热图分析。

## 1 创建页面组

![](https://2207941107-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LaKVSdcX30MGZ24jKF_%2F-LoVTtpRp7ZN3IwOsRSb%2F-LoVWkCXMzjBPt-mSgpS%2F%E5%88%9B%E5%BB%BA%E9%A1%B5%E9%9D%A2%E7%BB%84.gif?alt=media\&token=7175aac8-3288-45bf-a027-5539f7a4ab1e)

可以设定一组或多组 URL 规则快速匹配一组具有相同结构的页面，支持 5 种URL规则：包含、开头为、结尾为、等于、正则表达式：

### 包含

任何包含输入字符串的URL。e.g. 输入URL 包含 abc，则将筛选出 abc.com、ark.abc.cn 等类似的URL；

### 开头为

任何开头为输入字符串的URL。e.g. 输入URL开头为<http://www.example.com/category=1，则将筛选出http://www.example.com/category=1\\&id=1、http://www.example.com/category=1\\&id=2> 等所有分类下的URL；

### 结尾为

任何结尾为输入字符串的URL。e.g. 输入URL结尾为 project-management，则将筛选出 <http://www.example1.com/project-management> 、 <http://www.example2.com/project-management> 等URL；

### 等于

和输入URL完全一样的网址，支持输入多个地址；

### 正则表达式

符合正则表达式的URL，通过通配符、定位符、分组等符号组成逻辑公式。e.g. (?=.\*page.\*)(?!.\*otherpage).\* 筛选出包含page 但是不包含 otherpage 的所有页面。

{% hint style="info" %}
规则中输入多个地址或特征时英文分号分隔
{% endhint %}

## 2 页面组管理

页面组的修改、复制、删除

![](https://2207941107-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LaKVSdcX30MGZ24jKF_%2F-LoVTtpRp7ZN3IwOsRSb%2F-LoVWqZONNPAxi-6yAWe%2Fimage.png?alt=media\&token=730d2a54-d2bf-4f75-912f-f67330370729)

## **附 正则表达式常用语法**

正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串，是对字符串操作的一种逻辑公式。

### 常用字符

正则表达式字符主要包含：通配符、定位符、分组等。

**通配符，**&#x53EF;以用来代替一个或多个字符，常用的有

| 符号 | 说明                | 示例                                                    |
| -- | ----------------- | ----------------------------------------------------- |
| \* | \*前的字符重复出现n次（n≥0） | <p>表达式是 argo\*ark </p><p>则argoark、argooooark都可以匹配</p> |
| ？  | ？前的字符重复出现0次或1次    | <p>表达式是 argo？ark </p><p>则只能匹配出argoark、argark</p>      |

**定位符，**&#x57FA;于指定位置的匹配，通常在开始或结束的位置

| 符号 | 说明       | 示例                                                                              |
| -- | -------- | ------------------------------------------------------------------------------- |
| ^  | 从开头匹配字符串 | <p>表达式是 ^ark</p><p>则 ark.analysys.cn、arkargo 可以匹配，但 docs.ark、argoark 等不匹配</p>   |
| $  | 以结尾匹配字符串 | <p>表达式是 ark$</p><p>则 doc.ark.cn、argoark 可以匹配，但 ark.analysys.cn、arkargo 等不匹配</p> |

更多可参考 <https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Guide/Regular_Expressions>

### **常用示例**

| 常见用法                                                   | 示例                                                                                                                                                                                            |                                                                                                                                                                                                                                                                                                          |                                                                                                                                                                                         |                                                                                                                                                                                                                                                               |
| ------------------------------------------------------ | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| 头部域名完全匹配 ，尾部带/或带?加参数                                   | <p>表达式：^<https://www.analysys.cn($>                                                                                                                                                           | /$                                                                                                                                                                                                                                                                                                       | /?.\*)<br></p><p>能匹配以下页面：<br><https://www.analysys.cn><br><https://www.analysys.cn/><br><https://www.analysys.cn/?utmsource=xx><br></p><p>不能匹配以下页面：<br><https://www.analysys.c/abc></p> |                                                                                                                                                                                                                                                               |
| 头部匹配 http 或 https 协议，并且匹配多个子域名                         | <p>表达式：^(http                                                                                                                                                                                 | https)://(ark                                                                                                                                                                                                                                                                                            | argo                                                                                                                                                                                    | qianfan).analysys.cn<br></p><p>匹配以下页面：<br><http://ark.analysys.cn><br><http://argo.analysys.cn><br><https://ark.analysys.cn><br><https://ark.analysys.cn/?utmsource=xx><br><https://qianfan.analysys.cn><br></p><p>不能匹配以下页面：<br><https://www.analysys.cn></p> |
| 指定头部匹配规则                                               | <p>表达式：^<http://analysys.cn/blog.*$><br></p><p>匹配以下页面：<br><http://analysys.cn/blog><br><http://analysys.cn/blog/><br><http://analysys.cn/blog/1194><br><http://analysys.cn/blog/1194#xxx></p> |                                                                                                                                                                                                                                                                                                          |                                                                                                                                                                                         |                                                                                                                                                                                                                                                               |
| 匹配 http 或 https开头链接，也可匹配不包含www或将www替换成其它由字母数字组合的子域名的情况 | <p>表达式：^(http                                                                                                                                                                                 | https)://\[a-z0-9]\*\[.]\*analysys.cn/view/sign/signup$<br></p><p>匹配以下页面：<br><http://www.analysys.cn/view/sign/signup><br><https://www.analysys.cn/view/sign/signup><br><http://analysys.cn/view/sign/signup><br><http://ark.analysys.cn/view/sign/signup><br><https://analysys.cn/view/sign/signup></p> |                                                                                                                                                                                         |                                                                                                                                                                                                                                                               |
| 匹配末尾数据必须在（10603到10782之间）                               | <p>表达式：^<http://analysys.cn/blog/10([6][1-9][0-9>]                                                                                                                                            | \[6]\[0]\[3-9]                                                                                                                                                                                                                                                                                           | \[7]\[0-7]\[0-9]                                                                                                                                                                        | \[7]\[8]\[0-2])$</p><p><br>匹配以下页面：<br><http://analysys.cn/blog/10603></p><p><http://analysys.cn/blog/10666><br><http://analysys.cn/blog/10782></p><p><br>不能匹配以下页面：<br><http://analysys.cn/blog/10884><br><http://analysys.cn/blog/10103><br></p>              |

{% hint style="info" %}
以上内容没有解答我的问题？[点击我来反馈](https://support.qq.com/products/118522/) 🚀
{% endhint %}
