<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>懒人采集器 _ 扒房网</title>
	<atom:link href="https://www.gxjlyf.com/tag/%e6%87%92%e4%ba%ba%e9%87%87%e9%9b%86%e5%99%a8/feed" rel="self" type="application/rss+xml" />
	<link>https://www.gxjlyf.com</link>
	<description>手机系统教程_手机软件教程_手机app使用教程_电脑软件教程_电脑系统教程</description>
	<lastBuildDate>Sun, 05 Jun 2022 14:23:19 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	
	<item>
		<title>关于今天说说懒人采集器采集重复数据的解决方法，欢迎转发。</title>
		<link>https://www.gxjlyf.com/416079.html</link>
		
		<dc:creator><![CDATA[bafang18]]></dc:creator>
		<pubDate>Sun, 05 Jun 2022 14:23:19 +0000</pubDate>
				<category><![CDATA[其他教程]]></category>
		<category><![CDATA[懒人采集器]]></category>
		<guid isPermaLink="false">https://www.chuwenyu.com/416079.html</guid>

					<description><![CDATA[相信很多朋友都遇到过以下问题，就是今天说说懒人采集器采集重复数据的解决方法，欢迎转发。。针对这个问题，今天小编 ...]]></description>
										<content:encoded><![CDATA[<p>相信很多朋友都遇到过以下问题，就是今天说说懒人采集器采集重复数据的解决方法，欢迎转发。。针对这个问题，今天小编就搜集了网上的相关信息，给大家做个今天说说懒人采集器采集重复数据的解决方法，欢迎转发。的解答。希望看完这个教程之后能够解决大家今天说说懒人采集器采集重复数据的解决方法，欢迎转发。的相关问题。</p>
<p>用户在使用懒人采集器执行网页采集任务的时候，常常会遇到重复采集字段内容的情况，有大量重复数据被添加到本地采集库中，为后续的信息处理带来麻烦。那么应该如何避免重复采集数据呢？</p>
<h2>懒人采集器采集数据重复怎么办？</h2>
<p>首先我们要分析采集数据出现重复的原因：一是在重复对相同网页进行字段采集之前没有清空之前的数据；二是网页本身存在重复数据，然后介绍解决方法。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142317-629cbc551b4d6.png" /></p>
<p>1、进入编辑任务采集配置界面，如果想避免某个字段重复采集，那么点击该字段表头右侧倒三角图标。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142317-629cbc5589d6f.png" /></p>
<p>2、然后会弹出字段采集设置界面，勾选【过滤重复】，然后点击【确定】即可。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142317-629cbc55bb3cc.png" /></p>
<p>3、如果想避免多个字段重复采集，点击逐个字段表头倒三角图标逐一设置即可，操作方法一样。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142317-629cbc55db118.png" /></p>
<p>以上就是今天说说使用懒人采集器如何避免重复采集的介绍，想要了解更多相关内容，大家可以登陆官网查看详细教程。</p>

<p><img src="https://www.gxjlyf.com/postviews/416079.png" /></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>今天说说懒人采集器如何采集多级网页。</title>
		<link>https://www.gxjlyf.com/416076.html</link>
		
		<dc:creator><![CDATA[bafang18]]></dc:creator>
		<pubDate>Sun, 05 Jun 2022 14:23:18 +0000</pubDate>
				<category><![CDATA[其他教程]]></category>
		<category><![CDATA[懒人采集器]]></category>
		<category><![CDATA[网页]]></category>
		<guid isPermaLink="false">https://www.chuwenyu.com/416076.html</guid>

					<description><![CDATA[相信很多朋友都遇到过以下问题，就是懒人采集器如何采集多级网页。。针对这个问题，今天小编就搜集了网上的相关信息， ...]]></description>
										<content:encoded><![CDATA[<p>相信很多朋友都遇到过以下问题，就是懒人采集器如何采集多级网页。。针对这个问题，今天小编就搜集了网上的相关信息，给大家做个懒人采集器如何采集多级网页。的解答。希望看完这个教程之后能够解决大家懒人采集器如何采集多级网页。的相关问题。</p>
<p>前面我们使用懒人采集器学习的教程主要是针对单级网页进行采集，而实际网络中大多数网页是多级网页（比如包含内容页），而采集多级网页时，使用懒人采集器的操作会有所不同，下面我们来具体介绍懒人采集器如何采集多级网页。</p>
<h2>懒人采集器如何采集多级网页？</h2>
<p>1、多级网页采集步骤和单级网页类似：【新建任务】&mdash;输入网址&mdash;采集配置。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142316-629cbc545fac6.png" /></p>
<p>2、如何判断该网页是否为多级网页？在多级网页自动生成的字段中必然包含一个或多个提取链接的字段（即提取属性为Href的字段）。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142316-629cbc548450c.png" /></p>
<p>3、点击该链接字段表头，选中该列后在中间菜单栏右侧会出现【深入链接页采集】选项。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142316-629cbc54a4397.png" /></p>
<p>4、点击【深入链接页采集】，系统自动创建一个新的配置选项卡，并自动打开选中字段的网址。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142316-629cbc54bff3c.png" /></p>
<p>5、这时采集模式也会默认【单条模式】，如果不是，就点击调整。</p>
<p>注意：</p>
<p>1）列表模式用于提取某个网页列表中的数据，预览中可看到多条数据</p>
<p>2）单条模式适用于采集内容详情页里的各项信息，如文章标题、时间、正文等。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142316-629cbc54db254.png" /></p>
<p>6、点击【增加字段】，首先手动提取网页中信息发布时间，由于标题在之前列表采集里已经提取过了，这里无需重复。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142317-629cbc5509683.png" /></p>
<p>7、再次点击【增加字段】，手动提取网页中信息正文。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142317-629cbc552b37a.png" /></p>
<p>8、这里要注意字段的取值属性调整为InnerHtml，这样才能保持原文格式。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142317-629cbc55610f6.png" /></p>
<p>今天说说懒人采集器如何采集多级网页的操作就介绍到这里，感兴趣的小伙伴可以按照以上教程多操作几次，相信能够很快掌握！</p>

<p><img src="https://www.gxjlyf.com/postviews/416076.png" /></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>我来教你懒人采集器如何设置手动生成字段。</title>
		<link>https://www.gxjlyf.com/416065.html</link>
		
		<dc:creator><![CDATA[bafang18]]></dc:creator>
		<pubDate>Sun, 05 Jun 2022 14:23:09 +0000</pubDate>
				<category><![CDATA[其他教程]]></category>
		<category><![CDATA[懒人采集器]]></category>
		<category><![CDATA[网页]]></category>
		<guid isPermaLink="false">https://www.chuwenyu.com/416065.html</guid>

					<description><![CDATA[相信很多朋友都遇到过以下问题，就是懒人采集器如何设置手动生成字段。。针对这个问题，今天小编就搜集了网上的相关信 ...]]></description>
										<content:encoded><![CDATA[<p>相信很多朋友都遇到过以下问题，就是懒人采集器如何设置手动生成字段。。针对这个问题，今天小编就搜集了网上的相关信息，给大家做个懒人采集器如何设置手动生成字段。的解答。希望看完这个教程之后能够解决大家懒人采集器如何设置手动生成字段。的相关问题。</p>
<p>用户在使用懒人采集器对网页进行信息采集时，常常需要添加手动字段，那么该如何做呢？下面我们就来简单演示，请看文章说明。</p>
<h2>懒人采集器如何手动生成字段？</h2>
<p>1、打开懒人采集器，点击右上角【新建任务】。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142306-629cbc4ac4965.png" /></p>
<p>2、弹出新建任务窗口，在【输入网址】右侧空白处粘贴要采集的网页网址。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142307-629cbc4b4d203.png" /></p>
<p>3、然后点击左侧【采集配置】，系统会自动生成字段列表。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142307-629cbc4b98926.png" /></p>
<p>4、点击界面中间菜单栏中的【增加字段】。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142308-629cbc4c359b0.png" /></p>
<p>5、接着点击【查找列表】，在其下拉菜单中选择【手动选择列表】。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142308-629cbc4c51685.png" /></p>
<p>6、然后选择要提取的字段内容，这里选取的字段内容一般是标题，点击列表中任意一行标题即可。当然也可以选择其他元素充当提取字段，操作一样。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142308-629cbc4c6ef74.png" /></p>
<p>7、如果用户点击的是网页链接，系统会弹出&ldquo;提示&rdquo;窗口，询问是否抓取该链接地址。点击【是】，就会同时提取链接标题和链接地址并在下方分别生成两个字段，点击【否】就会只提取标题文本形成一个字段，这里我们点击【是】。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142308-629cbc4ca322d.png" /></p>
<p>8、之后系统会在界面下方字段列表中对应标题和链接分别生成两个字段，当用户选择这两个字段标题时，上方网页列表中会以黄色底纹高亮显示对应匹配的内容。用户可以添加多个字段，操作类似。</p>
<p><img decoding="async" src="https://dz.cwhello.com/wp-content/uploads/2022/06/20220605142308-629cbc4cc0a76.png" /></p>
<p>以上就是今天说说使用懒人采集器如何手动生成字段的方法介绍，你学会了吗？</p>

<p><img src="https://www.gxjlyf.com/postviews/416065.png" /></p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
