大数据时代,各行各业对数据采集的需求日益增多,网络爬虫的运用也更为广泛,越来越多的人开始学习网络爬虫这项技术,K哥爬虫此前已经推出不少爬虫进阶、逆向相关文章,为实现从易到难全方位覆盖,特设【0基础学爬虫】专栏,帮助小白快速入门爬虫,本期为数据存储。概述
MySQL:一种关系型数据库管理系统,广泛用于企业级应用程序中在本文中,我们将分别介绍 MySQL、MongoDB 和 Redis 的优缺点、适用场景以及如何选择最适合自己的数据库存储技术。作为爬虫初学者,本文将帮助你更好地理解这三种数据库存储技术的工作原理,以及如何选择适合你的应用程序的数据库。
MongoDB:一种文档型数据库,适合处理半结构化数据和大规模数据集。
Redis:一种内存数据库,用于处理高速读写操作和缓存数据。
host:IP地址连接数据库后,调用 cursor() 方法获取对数据库的操作游标,通过游标可以执行 sql 语句。
user:用户名
password:密码
database:库名
port:数据库端口
charset:字符集编码
字符串:字符串(string)是 redis 最基本的数据类型,它可以包含任意数据。Python 操作 Redis
哈希:哈希(hash)是一个键值对集合,是一个 string 类型的 field 和 value 的映射表。
列表:列表(list)是简单的字符串列表,按插入顺序排序,reids 列表支持在它的头尾部插入数据。
集合:集合(set)是字符串类型的无序集合,集合内的元素具有唯一性。
有序集合:有序集合(zset)与集合一样也是字符串类型的集合。不同的是有序集合中每个元素都会关联一个 double 类型的分数,它会通过分数来对元素进行升序排序。
欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) | Powered by Discuz! X3.4 |