相关文章
爬虫实战:爬取豆瓣电影 Top-250 到 Excel 表格中
最近在家无聊自学了python的一些基础知识。后来看到许多朋友都在写爬虫,自己感觉很有意思,也想试一下 >____< 其实本来我是想将数据爬取到excel之后再增加一些数据库操作,然后用flash建立一个网站将数据导入这个网站中实现数据可视化来着… 但!!!当我万分激动地上号…
建站知识
2024/12/21 12:26:10
基于BERT的豆瓣电影评论内容情绪分析
基于BERT的豆瓣电影评论内容情绪分析 MangoGO 芒狗狗 目录 0 写在前面0.1 本文目标0.2 BERT简介0.3 豆瓣评论数据0.4 抱抱脸(HuggingFace)网站 1 BERT文本分类过程1.1 BERT文本分类原理1.2 数据准备1.3 训练过程1.4 推理过程 2 结果评估3 其他文本分类方…
建站知识
2024/12/15 8:26:30
获取豆瓣用户看过的电影名以及评分,短评,标签等
数据定向到mysql数据库中,并备份到本地文件
#/bin/bash# name: get_see_movies.sh
# version: 1.0
# ceateTime: 2018-08-12
# description: 输入豆瓣用户id,获取所有看过的电影以及评分,标签等,并存到数据库中
# author: …
建站知识
2024/10/1 12:21:28
App优化以及内存泄漏溢出优化
目录介绍
1.OOM和崩溃优化 1.1 OOM优化1.2 ANR优化1.3 Crash优化2.内存泄漏优化 2.0 动画资源未释放2.1 错误使用单利2.2 错误使用静态变量2.3 handler内存泄漏2.4 线程造成内存泄漏2.5 非静态内部类2.6 未移除监听2.7 持有activity引用2.8 资源未关闭2.9 其他原因3.布局优化 …
建站知识
2024/12/18 13:50:48
求助!网站重构需要帮手(前端)
我们的 HelloGitHub.com 官网,自从 2017 年上线就一直长这样: 这个网站是我用 Flask 写的,因为我不怎么会写前端,再加上项目并不是前后端分离,想要帮忙的前端小伙伴也无从下手。所以这么多年下来网站的样式和功能没有什…
建站知识
2024/12/21 20:47:40
python爬取豆瓣书籍_Python爬虫-爬取豆瓣图书Top250
豆瓣网站很人性化,对于新手爬虫比较友好,没有如果调低爬取频率,不用担心会被封 IP。但也不要太频繁爬取。
涉及知识点:requests、html、xpath、csv
一、准备工作
需要安装requests、lxml、csv库
二、分析页面源码
打开网址&a…
建站知识
2024/12/14 15:52:20
豆瓣python源码_(附源码)Python爬虫之豆瓣攻坚战
我:好无聊鸭~有没有好电影推荐一下鸭? 惨绿青年:你不是会制作python爬虫了吗?自己去豆瓣top250爬一下呗。 我:诶,居然还有这样的网站,让我赶紧去瞧瞧。 于是Paradoxical就打开了豆瓣top250的网址…
建站知识
2024/11/28 4:00:51
Chrome 开发工具、Elements标签与Network标签及豆瓣电影网页分析
Chrome 开发工具、Elements标签与Network标签及豆瓣电影网页分析
1.以分析豆瓣电影为例https://movie.douban.com/ 打开Chrome 开发者工具快捷键F12,或空白处单击右键选择“检查”,下图所示。 左边为网页原页面,右边为开发者工具界面。 2.熟…
建站知识
2024/12/21 20:54:53