爬虫 python的第一天

news/2024/9/22 10:30:34

1、安装pycharm及python相关的安装

2、新建python项目

3、引包 import requests

pip install requests

4、打开网页,找打你想要爬的数据URL

 

5、写代码获取到对应的数据,保存到本地。

import requestsurl = "https://sns-video-al.xhscdn.com/stream/110/259/01e640315b0ef9f2010371038f6acf0431_259.mp4"
req = requests.get(url) # 请求地址
print(req.content) # 打印请求地址的返回的内容
name = "小三"# 下载到本地,参数1为保存到本地的文件名(任意名字),参数2为操作,读写w(write),r(read),wb(写二进制文件,如视频、音频),rb(读二进制文件)
open("测试.txt", "w").write(name) 
open("测试1.mp4", "wb").write(req.content)

6、最后看到一个免费看各大会议视频的代码,也给大家分享一下

<!DOCTYPE html>
<html lang="zh">
<head><meta charset="UTF-8"><title>VIP视频解析</title><style>/* 设置整个网页的背景颜色 */body {background-color: #505050;font-size: 15px;}/* 设置搜索框,让其垂直居中 */.search {margin-top: 50px;text-align: center;}.search input {width: 500px;height: 24px;outline: none;}.search button {vertical-align: center;}/* 设置播放器的宽高和背景色 */iframe {display: block;width: 1000px;height: 500px;margin: 30px auto;background-color: #dddddd;}p {color: #000;text-align: center;}</style>
</head>
<body><!--搜索栏-->
<div class="search"><input type="text" id="text"><button type="button" onclick="input_parse1()">线路一</button><button type="button" onclick="input_parse2()">线路二</button><button type="button" onclick="input_parse3()">线路三</button><button type="button" onclick="reset()">清空</button>
</div><iframe src="" frameborder="0" id="player" scrolling="no" allowfullscreen allowtransparency></iframe>
<p>在搜索栏输入地址后,按回车键即可解析,按Esc可以清空地址栏</p><script>const _0x28d9b8 = _0x2725;function _0x2725(_0x14a593, _0x55d166) {const _0x5edc91 = _0x5edc();return _0x2725 = function(_0x2725b7, _0xf3fcf0) {_0x2725b7 = _0x2725b7 - 0xbb;let _0x52dcae = _0x5edc91[_0x2725b7];return _0x52dcae;},_0x2725(_0x14a593, _0x55d166);} (function(_0x31e00c, _0x5acf25) {const _0x208716 = _0x2725,_0x1b0757 = _0x31e00c();while ( !! []) {try {const _0x429405 = -parseInt(_0x208716(0xbc)) / 0x1 + -parseInt(_0x208716(0xc1)) / 0x2 + -parseInt(_0x208716(0xcb)) / 0x3 * (parseInt(_0x208716(0xbf)) / 0x4) + parseInt(_0x208716(0xbd)) / 0x5 + parseInt(_0x208716(0xc5)) / 0x6 + -parseInt(_0x208716(0xc3)) / 0x7 * (parseInt(_0x208716(0xbe)) / 0x8) + parseInt(_0x208716(0xc4)) / 0x9;if (_0x429405 === _0x5acf25) break;else _0x1b0757['push'](_0x1b0757['shift']());} catch(_0x720fd7) {_0x1b0757['push'](_0x1b0757['shift']());}}} (_0x5edc, 0x1f7f3));let parse_url = _0x28d9b8(0xcd),parse_url2 = 'aHR0cHM6Ly93d3cucGxheW0zdTguY24vamlleGkucGhwP3VybD0=',parse_url3 = _0x28d9b8(0xc9),input = document[_0x28d9b8(0xcc)](_0x28d9b8(0xcf)),player = document['getElementById']('player');function play(_0x5ae5d3) {const _0x1bb1c9 = _0x28d9b8;player[_0x1bb1c9(0xc2)] = _0x5ae5d3;}function _0x5edc() {const _0x9a8ace = ['aHR0cHM6Ly9zdmlwLmJsamlleC5jYy8/dj0=', 'indexOf', 'text', 'substr', 'keyCode', '176039LCjagB', '291385usxdWD', '1592kcHAar', '3188qDTIaf', 'length', '462336agzEkq', 'src', '1519ziyFVB', '5529447dIQdvF', '329898GFpqxY', 'preventDefault', 'value', 'keyup', 'aHR0cHM6Ly9pbTE5MDcudG9wLz9qeD0=', 'search', '558bjZbnx', 'getElementById'];_0x5edc = function() {return _0x9a8ace;};return _0x5edc();}function input_parse1() {let _0x4d309f = atob(parse_url) + input['value'];play(_0x4d309f);}function input_parse2() {const _0x5649bb = _0x28d9b8;let _0x47040c = atob(parse_url2) + input[_0x5649bb(0xc7)];play(_0x47040c);}function input_parse3() {const _0x4dd4b4 = _0x28d9b8;let _0x19c0b2 = atob(parse_url3) + input[_0x4dd4b4(0xc7)];play(_0x19c0b2);}function reset() {input['value'] = '';}input['addEventListener'](_0x28d9b8(0xc8),function(_0x32b858) {const _0x32cd55 = _0x28d9b8;_0x32b858[_0x32cd55(0xc6)]();if (_0x32b858['keyCode'] === 0xd) input_parse();else _0x32b858[_0x32cd55(0xbb)] === 0x1b && reset();});let tmp = location[_0x28d9b8(0xca)],href = tmp[_0x28d9b8(0xd0)](tmp[_0x28d9b8(0xce)]('?')),reg = 'url=([^&]*)',url = href['match'](reg)[0x0];url !== null && url[_0x28d9b8(0xc0)] > 0x4 && (url = url[_0x28d9b8(0xd0)](url[_0x28d9b8(0xce)]('url=') + 0x4), location_parse(url));function location_parse(_0x1acf24) {let _0x54df90 = parse_url + _0x1acf24;play(_0x54df90),input['value'] = _0x1acf24;}
</script></body>
</html>

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ryyt.cn/news/31450.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

第 4 节 多元复合函数的求导法则

第四节 多元复合函数的求导法则 1. 一元函数与多元函数复合的情形2. 多元函数与多元函数复合的情形

MinIO入门教程

是什么? MinIO 是一种高性能、S3 兼容的对象存储。它是为 大规模 AI/ML、数据湖和数据库工作负载。它是软件定义的 并在任何云或本地基础设施上运行。 MinIO 具有双重许可 根据开源 GNU AGPL v3 和商业企业许可证 特点简单 简单性是百亿亿次数据基础设施的基础——无论是技术上…

shell条件语句

一、测试 文件测试testtest的语法 test 条件表达式 [ 条件表达式 ] test 选项 文件 -d :判断是否是目录(Directory) -f :判断是否是普通文件(File) -b :判断是否是块设备(block) -c :判断是否是字符设备 -e :判断是否存在 (Exist) -a :判断是否存在 -r :判断…

发掘 Chrome 的实用命令:提升你的浏览器使用体验

前言 在日常使用浏览器时,大多数人只是简单地浏览网页、搜索信息或者查看邮件。但是,其实 Chrome 浏览器有许多隐藏的功能和命令,可以帮助用户更高效地使用浏览器,提升工作和生活的效率。本文将介绍一些实用的 Chrome 命令,让你的浏览器技能更上一层楼。查看所有命令chrom…

干电池升压芯片PW5100:高效转换,赋能小型设备

内容简述目录:1,干电池的工作电压范围2,平芯微根据干电池规格书整理的干电池输出电流性能表3,干电池负载能力的理解和解释4,专用干电池升压芯片 PW51005,干电池升压芯片采用 0603,0805,1206 电感和输出电流测试6,干电池升压芯片真关断控制版本 PW51037,电荷泵升压 IC 和…

Playwright执行 JavaScript 脚本:探索浏览器自动化的新境界

前言 我们在进行web自动化时,经常遇到一些不好操作的元素,普通的元素定位和操作容易报错,如果我们使用的selenium的话,就可以使用selenium调用js脚本进行操作。在playwright 中也有类似的方法,使用page.evaluate()执行JavaScript脚本。 page.evaluate()和page.evaluate_ha…

互联网发展对计算机及其应用的影响

先来说一个问题,就是zookeeper leader选举问题直接说结论,通过逻辑时钟(zxid)来保证事件发生的因果关系,因果最新的节点优先被选为主,其他小弟跟着同步,如果大家因果相同那就用server id决断作为兜底方案。解释下什么逻辑上时钟?通过数值来记录事件的因果关系,比如a去…

第十一周实验

Pixso特点实时协作——让所有人聚焦同一个目标 当面对一个复杂的设计项目时,通过链接邀请团队成员,进行多人云端协作设计,实时同步字号、边框、颜色等各种细节。 智能UI设计工具——快速上手专业技能 传统产品,往往要多个工具协作才能预期效果。而Pixso自带组件变体、自动布…