北京酒渣鼻网上医院 http://news.39.net/bjzkhbzy/210117/8598835.html

俗谚有云,炙热三伏钓朝夕。那末啤酒配上小龙虾,岂不甚妙哉?本文是一篇吃货指南,给庞大的小龙虾嗜好者扒一扒,那边的小龙虾才是一绝。

题图泉源:金渡广告照相

赢得数据

本次数据咱们爬取了群众点评中一切打上小龙虾标签的餐厅。

从上图中也许看出,咱们也许赢得餐厅的人均花费、点评数目、举荐菜、评分(口味、处境、效劳)等音信,用于咱们以后的剖析。咱们这回一共爬取到了个都邑,个餐厅,.3万条议论。

咱们截取个中的部份重点代码:

dffind_city_pag(path):

data=pd.rad_xcl(path)

city_lobstr_pag=pd.DataFram()

drivr=wbdrivr.Chrom()

foriinrang(0,ln(data)):

try:

js=window.opn("+data[city_lobstr_url][i]+")

drivr.xcut_script(js)

bsObj=BautifulSoup(drivr.pag_sourc,html.parsr)

bs=bsObj.find_all(a,attrs={class:PagLink})

this_city_lobstr={city_nam:data[city_nam][i],

pag_num:max([int(l.txt)forlinbs])}

city_lobstr_pag=city_lobstr_pag.appnd(this_city_lobstr,ignor_indx=Tru)

xcpt:

continu

rturncity_lobstr_pag

都邑对照

首先要施行剖析的是各个都邑的小龙虾热度。咱们以带有“小龙虾”标签的餐厅议论总和做为最后的对照根据,赢得的TOP20都邑如下:

也许看出上海市的点评数遥遥率先,也许存在如下两个要素:a.上海市的小龙虾餐厅数目较多,自己存在较大的花费全体;b.群众点评总部在上海,上海的商户入驻数目较多。有兴致的挚友也许施行更深一步的研讨。

圈定了TOP20都邑后,咱们首先看一下TOP20都邑小龙虾的人均花费:

该项统计中,包邮区据有了靠前的地方,显示出来包邮区对小龙虾的盛情和自己的花费程度。同时也许看到株洲的人均花费濒临于上海的一半,有时机到湖南游览的挚友也许琢磨到株洲品味价廉物美的小龙虾。

紧接着要看的是TOP20都邑滋味、处境、效劳三部份的分数情形:

咱们发掘效劳分与处境分排序雷同,两者具备极强的关系性,合适每每认知。同时也许看到在三项分数中,朔方的四个都邑天津、西安、北京、青岛各项目标均处于靠前的地方,个中天津的效劳和处境均处于首位。

聚集下图天下小龙虾热力争,仿佛有些有悖于众人的认知。

由此咱们也许得出在小龙虾整个热度对照强的地域,人们关于小龙虾各方面的请求会响应提升,相悖在整个热度偏低地域,人们评估时会相对宽恕。同时咱们看到海口的各项目标均处于末了一位,须要施行响应的调换。

寻求龙虾

咱们看过了各个都邑的情形后,进一步看一下小龙虾自己的一些兴味的实质,首先看一下龙虾的口味,咱们采取了各个餐厅中带有龙虾的举荐菜,分词后赢得TOP20的口味:

十三香、蒜蓉、麻辣高居前三位,遵循笔者的阅历,这根基上是合适众人整个口味的抉择。TOP20中的蛋*、白灼关于笔者而言相对生疏,有品味过的挚友也许分享一些这些口味的体会。

看结束口味,再看一下龙虾的好丽友:

螺丝、花甲、毛豆位高居TOP3,看来众人吃龙虾的时分,会期盼同时抉择一些不必摘手套就也许享受的食品,终归吃的历程中一再摘手套会对照费力。

龙虾画像

当前互联网公司中特别普随处会施行一些人群画像的剖析,咱们在这边借用一下这个观点,也为小龙虾绘制一幅专属的画像。上面展现的两幅图离别是词云图和模板原图:

部份词云绘制代码如下:

#分析小龙虾图片

back_color=imrad(小龙虾.jpg)#分析该图片

#参数设置

wc=WordCloud(background_color=whit,#布景颜色

max_words=,#最大词数

mask=back_color,#以该参数值做图绘制词云,这个参数不为空时,width和hight会被疏忽

max_font_siz=,#显示字体的最大值

font_path="C:/Windows/Fonts/simhi.ttf",#处理显示口字型乱码题目,可加入C:/Windows/Fonts/目录退换字体

random_stat=4,#为每个词返回一个PIL颜色

#width=,#图片的宽

#hight=#图片的长

)

#经过ncountr计数器生成词云

wc.gnrat_from_frquncis(word_counts)

#基于彩色图象生成响应彩色

imag_colors=ImagColorGnrator(back_color)

#绘制词云

plt.figur()

plt.imshow(wc.rcolor(color_func=imag_colors))

plt.axis(off)

特(hi)色(an)龙虾

文章末了咱们放上几个以前分词发掘的特征口味龙虾,兴许下一个网红龙虾就在个中。

这些小龙虾的口味是你喜爱的吗?

做家:徐麟,知乎同名专栏做家,当前到差于上海唯品会产物技艺核心,哥大统计数据狗,从事数据开采剖析做事,喜爱用RPython玩一些不相同的数据。小我



转载请注明地址:http://www.aozhoulongxiaa.com/azlxsh/10939.html