社区 发现 Amazon 【运营技术探讨】根据搜索引擎工作原理怎么...
【运营技术探讨】根据搜索引擎工作原理怎么运营好一条listing-----(一)怎么写撰写listing?
这个分析内容是亚马逊搜索算法的基本逻辑,其中有很多是搜索算法通用的内容,我不懂亚马逊A9的核心算法,除了写亚马逊搜索算法团队的人没人知道算法核心,就是为了讨论一下,望别杠!
先看一下,买家搜索一个产品到最后购买它,用户和亚马逊后台的基本流程:
图为人机交互过程
在第一阶段中“调出所有符合条件的listing使用算法进行打分排序”这个对新的listing进行第一次的计算打分过程(没有用户浏览数据,就没有用户体验分值)-----称新的listing数据搜集处理及第一次计算分值的过程为算法的静态过程。
在第二阶段中“根据用户行为,使用算法对listing这次表现进行打分,对结果重新排序,等待下一次调用-------(对用户进行评价)”当有了用户体验以后,listing的分值=静态分值(基础分值)+动态分值(用户体验分)-------人机交互称这个过程为算法的动态过程。
(一)静态过程1)过程分析静态过程大概如下:
数据收集→【文本转换→解析→停止词去除→词干提取→信息提取】→分类→索引创建→文档统计→加权-正向索引-倒排索引
详细点的解析在下面,有兴趣的可以看一下,没兴趣的只看一下“加权-正向索引”就可以
1.listing数据收集:对新listing进行打分第一步要有listing的打分内容和传统搜索引擎(Google,百度)使用爬虫收集相关文本相比,亚马逊主要是通过卖家上传的listing进行收集listing内容,用卖家填写的listing来进行搜集信息,同时亚马逊自己规定了大部分填写内容和格式,文本搜集更加全面,对后续算法步骤更加友好。(正确的填写亚马逊产品表格十分重要)如果这个产品页面信息是未被收录的,则会对这个产品进行进行收录,如果发现这个产品页面已经有些更新,则会重新对该页面进行收录。(收录:把产品信息加入搜索引擎,可以通过关键词搜索出来)
2.文本转换:把人看的listing翻译成机器看的listing
原始文本:Basic Calculator:XXX CD-8185 Office and Home Style Calculator–8-Digit–Educational - Suitable for School and Destop-use (Purple)
解析后:Basic+Calculator%3A+XXX+CD-8185+Office+and+Home+Style+Calculator+%E2%80%93+8-Digit+%E2%80%93+Educational+-+Suitable+for+School+and+Destop-use+%28Purple%29
去停止词词干提取去除特殊符号等后:Basic+Calculator+XXX+CD-8185+Office+Home+Style+Calculator+8-Digit+Educational+Suitable+School+Destop-use+Purple
3.解析器(通俗说法:分词)搜索引擎中的解析器主要负责处理文档中的文本词素序列,这就涉及到分词的问题了,更好地理解词与词组的意思。
4.停止词去除有一些词在句子中只是让句子更通顺,并非起着非常重要的功能性上的作用,比如英文的“to”、“of”、“on”等,中文的“的”、“地”、“得”等。当然也可能存在实际的价值,如“大地”中的“地”就是有一定价值的词,不能当做停止词而被去除。
5.词干提取针对于英文而言,需要提取词的词干,比如“fishing”提取fish。
6.信息的提取对于页面上到底是与哪些词相关的,哪个店铺发布的,什么时间发布的,比如“Apple”到底是水果的意思还是iPhone公司相关产品的意思,需要对标题,五点,描述的内容进行拆分成众多词组,进行理解这个产品页面里面的apple到低是什么意思。(和类目选择相互印证,如果类目错误较大会有相关惩罚的,没有搜索展示,做不了广告等)
7.分类分类组件对页面都打上归属标签,比如是关于体育的,还是关于IT的,亦或者是娱乐的。(理解的信息和类目选择相互印证,如果类目错误较大会有相关惩罚的,没有搜索展示,做不了广告等)
8.索引创建索引就是帮助程序进行快速查找的。大家都用过新华字典。字典前边的按照偏旁部首查字的部分就是索引。搜索引擎也一样。
9.文档统计文档统计简单汇总和记录词、特征和文档的统计信息。搜索引擎所拥有的文档中出现的每一个单词都拥有一个反转列表。它记录了这个单词在多少文档中出现,分别是哪些文档,每个文档分部出现多少次,分别出现在什么位置等信息。为了提高搜索质量,搜索引擎需要对文档的不同部分分别处理,构造反转列表。每一部分的单词都要被加入到这个词属于此部分的反转列表里。
10.加权-正向索引加权是搜索引擎的排名非常重要,它是搜索引擎对页面识别并处理后的初始权重,体现出了文档中某些词的相对重要性,而这个加权结果是通过搜索引擎检索模型来确定下来的。
11.倒排索引倒排索引组件是搜索引擎的核心组件,是将文档对应多个索引项的形式,转化成为索引项对应多个文档的形式,这种做法称之为建立倒排索引。
2)自己总结的撰写listing的思路
静态过程主要是涉及撰写listing,而listing撰写主要是关键词布局和相关性,推广之前,关键词布局主要在“标题、五点、产品描述、ST”,推广之后关键词布局还要加上“QA和评论”
1. 关键词的选择:关键词一般是选择短的词组,搜索量大,曝光量大,当然竞争也大,有一般就有特殊的选词方法,选一个包含核心短词组的长尾关键词,放到标题里面,通过一段时间的高数据指标提高核心短词组的权重,最后优化到核心短词组为关键词。2. 标题:产品关键词+修饰词,重要的的关键词放前面,从左到右排序,不要堆砌关键词,注意语句通顺,意思完整。恶意堆砌关键词有可能被系统惩罚语句不通,影响用户体验修饰词不是没有作用的,他可以起到引导推销,使消费者进入相对意境产品关键词包含:核心关键词,宽泛关键词,长尾关键词,根据产品,习惯,当前状态不同,可以全用也可以组合着用,但必须要有一个核心关键词,是曝光和转化相对平衡。
3. 五点:一般写关于产品核心卖点、尺寸、功能、特点、我们和同行的差异化卖点(特有的优点)等,我一定会写的是使用场景和售后,关于埋词,核心关键词埋在第一点里面,如果不好安排可以放到第二点里面,重要程度依次后排,通顺的介绍产品是第一要务,可以不埋那么多,没有关系的。使用场景有代入感,增强购买欲售后你不写,FBA也会这么干的,写了还能增强信任感
4. 产品描述:主要写产品参数、包装信息、温馨提示和使用场景即可,通顺符合老外阅读习惯,在合适的位置埋词就行。
5. ST:我一般是不写,如果写的主要是写一些搜索框下拉词,买家搜索使用频率高,注意不要放入别人的品牌,不要重复即可6. QA:会自己提前准备几条,在到货之后,会每天安排1-2条,会在问题和回答中都埋核心词,其他词看情况,如果产品销售的国家使用多种语言,每种语言都会安排2条问答,问题内容如果有同行的,一定要竞调一下,看一下消费者关心的问题,找出对我们有力的,上上去。
7. 评价:会先埋核心关键词,最后让他出现在“Read reviews that mention”
核心要点:有同行的一定要竞调同行的,在小类前十的选几家抄就行,不要自己搞,出力不讨好,等自己的listing能进前20在个性化测试吧,不要一字不动的抄,所有的搜索引擎都喜欢新的,原封不动的抄会被降权的,自己做适当修改就行。
3)有两个话题:
1. 关于各个部分埋词权重的排序:标题、五点、产品描述、ST、评价、QA,有人验证过他们的排序吗?怎么验证的?
猜测:标题>五点、产品描述、ST、进入“Read reviews that mention”的关键词(这几个近似相等,五点前面可能略高一点)>QA
2. 假设标题的权重是100,我们现在的习惯是多埋关键词,那如果我少埋关键词,会不会使我的关键词词组权重变高?(如果标题是ABCDE权重为100,那关键词BC权重为40,把标题缩短为ABC,那BC的权重为66)这种假设有可能吗?有人验证过吗?
49 个回复
芜湖666 - 精铺小麦白帽可交流
赞同来自: 白玉京 、 梦内倾心 、 芒果琪子 、 天选打工仔 、 卢卢卢 、 Book思议的辣 、 leniania 、 Leanne 、 穆凡晓晓 、 叫我张张 、 愿知世故却不世故 、 light0 、 三木SANMU 、 鱼鱼非鱼 、 Jia_玲 、 杨家菇娘888 、 星垂平野 、 小泥巴168 、 平凡人生 、 Joylee29 、 娇妹儿 、 一颗芋头aa 、 小陈的亿点点 、 小虫子 、 筑一宁静之地 、 windrunner 、 张无趣 、 这家伙很懒呀 、 Adora1991 、 gundam157 、 鱼罐头 、 lgl1996 、 LyonYYYY 更多 »
第二个问题倒是可以通过测试验证一下,不过在产品整体上来说,短期是看不出效果的,因为通常产品的关键词,通过购买的加权远超过单纯的写关键词权重,静态上短词组可能一开始确实排名靠前,但是多一两个词的购买加权会促使整权重超过短的词组
2、太多的词组埋词让抓取变得复杂,流量不精确,反而适得其反(流量多不转化或者错误的逻辑上面描述的原因),适当的词组(一定量精准曝光)+适当动态转化(精准转化),动态的加权更利于链接的推广,在平台早期的叠加应该是算法系统的不完善学习必经路径。