Python中itertools模块如何使用

时间：2023-05-28

阅读：

itertools — 为高效循环而创建迭代器的函数

accumulate(iterable: Iterable, func: None, initial:None)

iterable：需要操作的可迭代对象

func：对可迭代对象需要操作的函数，必须包含两个参数

initial: 累加的开始值

当使用func对可迭代对象进行双目运算时，需要提供两个参数。返回的是迭代器，与这个方法类似的就是functools下的reduce，reduce和accumulate都是累计进行操作，不同的是reduce只会返回最后的元素，而accumulate会显示所有的元素，包含中间的元素，对比如下：

区别	reduce	accumulate
返回值	返回的是一个元素	返回的是一个迭代器（包含中间处理的元素）
所属模块	functools	itertools
性能	略差	比reduce好一些
初始值	可以设置初始值	可以设置初始值

import time
from itertools import accumulate
from functools import reduce

l_data = [1, 2, 3, 4]
data = accumulate(l_data, lambda x, y: x + y, initial=2)
print(list(data))
start = time.time()
for i in range(100000):
    data = accumulate(l_data, lambda x, y: x + y, initial=2)
print(time.time() - start)
start = time.time()
for i in range(100000):
    data = reduce(lambda x, y: x + y, l_data)
print(time.time() - start)
#输出
[2, 3, 5, 8, 12]
0.027924537658691406
0.03989362716674805

由上述结果可知，accumulate比reduce性能稍好一些，而且还能输出中间的处理过程。

chAIn(*iterables)

iterables:接收多个可迭代对象

依次返回多个迭代对象的元素，返回的是一个迭代器,对于字典输出元素时，默认会输出字典的key

from itertools import chain
import time

list_data = [1, 2, 3]
dict_data = {"a": 1, "b": 2}
set_data = {4, 5, 6}
print(list(chain(list_data, dict_data, set_data)))

list_data = [1, 2, 3]
list_data2 = [4, 5, 6]

start = time.time()
for i in range(100000):
    chain(list_data, list_data2)
print(time.time() - start)

start = time.time()
for i in range(100000):
    list_data.extend(list_data2)
print(time.time() - start)
#输出
[1, 2, 3, 'a', 'b', 4, 5, 6]
0.012955427169799805
0.013965129852294922

combinations(iterable: Iterable, r)

iterable:需要操作的可迭代对象

r: 抽取的子序列元素的个数

操作可迭代对象，根据所需抽取的子序列个数返回子序列，子序列中的元素也是有序、不可重复并且是以元组的形式呈现的。

from itertools import combinations


data = range(5)
print(tuple(combinations(data, 2)))
str_data = "asdfgh"
print(tuple(combinations(str_data, 2)))
#输出
((0, 1), (0, 2), (0, 3), (0, 4), (1, 2), (1, 3), (1, 4), (2, 3), (2, 4), (3, 4))
(('a', 's'), ('a', 'd'), ('a', 'f'), ('a', 'g'), ('a', 'h'), ('s', 'd'), ('s', 'f'), ('s', 'g'), ('s', 'h'), ('d', 'f'), ('d', 'g'), ('d', 'h'), ('f', 'g'), ('f', 'h'), ('g', 'h'))

combinations_with_replacement(iterable: Iterable, r)

与上述的combinations(iterable: Iterable, r)类似，不过区别在于，combinations_with_replacement的子序列的元素可以重复，也是有序的，具体如下：

from itertools import combinations_with_replacement


data = range(5)
print(tuple(combinations_with_replacement(data, 2)))
str_data = "asdfgh"
print(tuple(combinations_with_replacement(str_data, 2)))
#输出
((0, 0), (0, 1), (0, 2), (0, 3), (0, 4), (1, 1), (1, 2), (1, 3), (1, 4), (2, 2), (2, 3), (2, 4), (3, 3), (3, 4), (4, 4))
(('a', 'a'), ('a', 's'), ('a', 'd'), ('a', 'f'), ('a', 'g'), ('a', 'h'), ('s', 's'), ('s', 'd'), ('s', 'f'), ('s', 'g'), ('s', 'h'), ('d', 'd'), ('d', 'f'), ('d', 'g'), ('d', 'h'), ('f', 'f'), ('f', 'g'), ('f', 'h'), ('g', 'g'), ('g', 'h'), ('h', 'h'))

compress(data: Iterable, selectors: Iterable)

data:需要操作的可迭代对象

selectors:判断真值的可迭代对象，不能时str，最好是列表、元组、之类的

根据selectors中的元素是否为true来输出data中对应索引的元素，以最短的为准，返回一个迭代器。

from itertools import compress


data = "asdfg"
list_data = [1, 0, 0, 0, 1, 4]
print(list(compress(data, list_data)))
#输出
['a', 'g']

count(start, step)

start: 开始的元素

step: 自开始元素增长的步长

生成一个递增的迭代器，其起点为start，递增步长为给定值，不会立即生成所有元素，推荐使用next()方法进行元素的递归获取。

from itertools import count


c = count(start=10, step=20)
print(next(c))
print(next(c))
print(next(c))
print(next(c))
print(c)
#输出
10
30
50
70
count(90, 20)

cycle(iterable)

iterable：需要循环输出的可迭代对象

返回一个迭代器，循环输出可迭代对象的元素。于count一样，最好不要将结果转换为可迭代对象，因为是循环，所以建议使用next()或者for循环获取元素。

from itertools import cycle

a = "asdfg"
data = cycle(a)
print(next(data))
print(next(data))
print(next(data))
print(next(data))
#输出
a
s
d
f

dropwhile(predicate, iterable)

predicate:是否舍弃元素的标准

iterable: 可迭代对象

通过对predicate的计算结果进行筛选，返回一个迭代器，在这个迭代器中舍弃那些计算结果为True的元素。无论后面的元素是True还是False，在predicate为False时都会输出。

from itertools import dropwhile


list_data = [1, 2, 3, 4, 5]
print(list(dropwhile(lambda i: i < 3, list_data)))
print(list(dropwhile(lambda x: x < 5, [1, 4, 6, 4, 1])))
#输出
[3, 4, 5]
[6, 4, 1]

filterfalse(predicate, iterable)

predicate:是否舍弃元素的标准

iterable: 可迭代对象

产生一个迭代器，在对每个元素执行操作前，判断其是否满足predicate条件。类似于filter方法，但是是filter的相反的.

import time
from itertools import filterfalse

print(list(filterfalse(lambda i: i % 2 == 0, range(10))))

start = time.time()
for i in range(100000):
    filterfalse(lambda i: i % 2 == 0, range(10))
print(time.time() - start)

start = time.time()
for i in range(100000):
    filter(lambda i: i % 2 == 0, range(10))
print(time.time() - start)
#输出
[1, 3, 5, 7, 9]
0.276653528213501
0.2768676280975342

由上述结果看出，filterfalse与filter性能相差不大

groupby(iterable, key=None)

iterable: 可迭代对象

key: 可选，需要对元素进行判断的条件, 默认为x == x。

返回一个迭代器,根据key返回连续的键和组（连续符合key条件的元素）。

注意使用groupby进行分组前需要对其进行排序。

from itertools import groupby


str_data = "babada"
for k, v in groupby(str_data):
    print(k, list(v))


str_data = "aaabbbcd"
for k, v in groupby(str_data):
    print(k, list(v))


def func(x: str):
    print(x)
    return x.isdigit()


str_data = "12a34d5"
for k, v in groupby(str_data, key=func):
    print(k, list(v))
#输出
b ['b']
a ['a']
b ['b']
a ['a']
d ['d']
a ['a']
a ['a', 'a', 'a']
b ['b', 'b', 'b']
c ['c']
d ['d']
1
2
a
True ['1', '2']
3
False ['a']
4
d
True ['3', '4']
5
False ['d']
True ['5']

islice(iterable, stop)\islice(iterable, start, stop[, step])

iterable: 需要操作的可迭代对象

start：开始操作的索引位置

stop: 结束操作的索引位置

step: 步长

返回一个迭代器。类似于切片，但是其索引不支持负数。

from itertools import islice
import time

list_data = [1, 5, 4, 2, 7]
#学习中遇到问题没人解答？小编创建了一个Python学习交流群：725638078

start = time.time()
for i in range(100000):
    data = list_data[:2:]

print(time.time() - start)
start = time.time()
for i in range(100000):
    data = islice(list_data, 2)
print(time.time() - start)
print(list(islice(list_data, 1, 3)))
print(list(islice(list_data, 1, 4, 2)))
#输出
0.010963201522827148
0.01595783233642578
[5, 4]
[5, 2]

0.010963201522827148
0.01595783233642578
[5, 4]
[5, 2]

由上述结果可以看出，切片性能比islice性能稍好一些。

pairwise(iterable)

需要操作的可迭代对象

返回一个迭代器, 返回可迭代对象中的连续重叠对，少于两个返回空。

from itertools import pairwise

str_data = "asdfweffva"
list_data = [1, 2, 5, 76, 8]
print(list(pairwise(str_data)))
print(list(pairwise(list_data)))
#输出
[('a', 's'), ('s', 'd'), ('d', 'f'), ('f', 'w'), ('w', 'e'), ('e', 'f'), ('f', 'f'), ('f', 'v'), ('v', 'a')]
[(1, 2), (2, 5), (5, 76), (76, 8)]

permutations(iterable, r=None)

iterable：需要操作的可迭代对象

r: 抽取的子序列

与combinations类似，都是抽取可迭代对象的子序列，不过，permutations是不可重复,无序的，与combinations_with_replacement刚好相反。

from itertools import permutations


data = range(5)
print(tuple(permutations(data, 2)))
str_data = "asdfgh"
print(tuple(permutations(str_data, 2)))
#输出
((0, 1), (0, 2), (0, 3), (0, 4), (1, 0), (1, 2), (1, 3), (1, 4), (2, 0), (2, 1), (2, 3), (2, 4), (3, 0), (3, 1), (3, 2), (3, 4), (4, 0), (4, 1), (4, 2), (4, 3))
(('a', 's'), ('a', 'd'), ('a', 'f'), ('a', 'g'), ('a', 'h'), ('s', 'a'), ('s', 'd'), ('s', 'f'), ('s', 'g'), ('s', 'h'), ('d', 'a'), ('d', 's'), ('d', 'f'), ('d', 'g'), ('d', 'h'), ('f', 'a'), ('f', 's'), ('f', 'd'), ('f', 'g'), ('f', 'h'), ('g', 'a'), ('g', 's'), ('g', 'd'), ('g', 'f'), ('g', 'h'), ('h', 'a'), ('h', 's'), ('h', 'd'), ('h', 'f'), ('h', 'g'))

product(*iterables, repeat=1)

iterables: 可迭代对象，可以为多个

repeat: 可迭代对象的重复次数，也就是复制的次数

返回迭代器。类比排列组合，生成笛卡尔积的可迭代对象。Product function is similar to zip function, but while zip matches elements one-to-one, product creates a one-to-many relationship.。

from itertools import product


list_data = [1, 2, 3]
list_data2 = [4, 5, 6]
print(list(product(list_data, list_data2)))
print(list(zip(list_data, list_data2)))

# 如下两个含义是一样的，都是将可迭代对象复制一份， 很方便的进行同列表的操作
print(list(product(list_data, repeat=2)))
print(list(product(list_data, list_data)))
# 同上述含义
print(list(product(list_data, list_data2, repeat=2)))
print(list(product(list_data, list_data2, list_data, list_data2)))
#输出
[(1, 4), (1, 5), (1, 6), (2, 4), (2, 5), (2, 6), (3, 4), (3, 5), (3, 6)]
[(1, 4), (2, 5), (3, 6)]
[(1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)]
[(1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)]
[(1, 4, 1, 4), (1, 4, 1, 5), (1, 4, 1, 6), (1, 4, 2, 4), (1, 4, 2, 5), (1, 4, 2, 6), (1, 4, 3, 4), (1, 4, 3, 5), (1, 4, 3, 6), (1, 5, 1, 4), (1, 5, 1, 5), (1, 5, 1, 6), (1, 5, 2, 4), (1, 5, 2, 5), (1, 5, 2, 6), (1, 5, 3, 4), (1, 5, 3, 5), (1, 5, 3, 6), (1, 6, 1, 4), (1, 6, 1, 5), (1, 6, 1, 6), (1, 6, 2, 4), (1, 6, 2, 5), (1, 6, 2, 6), (1, 6, 3, 4), (1, 6, 3, 5), (1, 6, 3, 6), (2, 4, 1, 4), (2, 4, 1, 5), (2, 4, 1, 6), (2, 4, 2, 4), (2, 4, 2, 5), (2, 4, 2, 6), (2, 4, 3, 4), (2, 4, 3, 5), (2, 4, 3, 6), (2, 5, 1, 4), (2, 5, 1, 5), (2, 5, 1, 6), (2, 5, 2, 4), (2, 5, 2, 5), (2, 5, 2, 6), (2, 5, 3, 4), (2, 5, 3, 5), (2, 5, 3, 6), (2, 6, 1, 4), (2, 6, 1, 5), (2, 6, 1, 6), (2, 6, 2, 4), (2, 6, 2, 5), (2, 6, 2, 6), (2, 6, 3, 4), (2, 6, 3, 5), (2, 6, 3, 6), (3, 4, 1, 4), (3, 4, 1, 5), (3, 4, 1, 6), (3, 4, 2, 4), (3, 4, 2, 5), (3, 4, 2, 6), (3, 4, 3, 4), (3, 4, 3, 5), (3, 4, 3, 6), (3, 5, 1, 4), (3, 5, 1, 5), (3, 5, 1, 6), (3, 5, 2, 4), (3, 5, 2, 5), (3, 5, 2, 6), (3, 5, 3, 4), (3, 5, 3, 5), (3, 5, 3, 6), (3, 6, 1, 4), (3, 6, 1, 5), (3, 6, 1, 6), (3, 6, 2, 4), (3, 6, 2, 5), (3, 6, 2, 6), (3, 6, 3, 4), (3, 6, 3, 5), (3, 6, 3, 6)]
[(1, 4, 1, 4), (1, 4, 1, 5), (1, 4, 1, 6), (1, 4, 2, 4), (1, 4, 2, 5), (1, 4, 2, 6), (1, 4, 3, 4), (1, 4, 3, 5), (1, 4, 3, 6), (1, 5, 1, 4), (1, 5, 1, 5), (1, 5, 1, 6), (1, 5, 2, 4), (1, 5, 2, 5), (1, 5, 2, 6), (1, 5, 3, 4), (1, 5, 3, 5), (1, 5, 3, 6), (1, 6, 1, 4), (1, 6, 1, 5), (1, 6, 1, 6), (1, 6, 2, 4), (1, 6, 2, 5), (1, 6, 2, 6), (1, 6, 3, 4), (1, 6, 3, 5), (1, 6, 3, 6), (2, 4, 1, 4), (2, 4, 1, 5), (2, 4, 1, 6), (2, 4, 2, 4), (2, 4, 2, 5), (2, 4, 2, 6), (2, 4, 3, 4), (2, 4, 3, 5), (2, 4, 3, 6), (2, 5, 1, 4), (2, 5, 1, 5), (2, 5, 1, 6), (2, 5, 2, 4), (2, 5, 2, 5), (2, 5, 2, 6), (2, 5, 3, 4), (2, 5, 3, 5), (2, 5, 3, 6), (2, 6, 1, 4), (2, 6, 1, 5), (2, 6, 1, 6), (2, 6, 2, 4), (2, 6, 2, 5), (2, 6, 2, 6), (2, 6, 3, 4), (2, 6, 3, 5), (2, 6, 3, 6), (3, 4, 1, 4), (3, 4, 1, 5), (3, 4, 1, 6), (3, 4, 2, 4), (3, 4, 2, 5), (3, 4, 2, 6), (3, 4, 3, 4), (3, 4, 3, 5), (3, 4, 3, 6), (3, 5, 1, 4), (3, 5, 1, 5), (3, 5, 1, 6), (3, 5, 2, 4), (3, 5, 2, 5), (3, 5, 2, 6), (3, 5, 3, 4), (3, 5, 3, 5), (3, 5, 3, 6), (3, 6, 1, 4), (3, 6, 1, 5), (3, 6, 1, 6), (3, 6, 2, 4), (3, 6, 2, 5), (3, 6, 2, 6), (3, 6, 3, 4), (3, 6, 3, 5), (3, 6, 3, 6)]

repeat(object[, times])

object：任意合法对象

times: 可选，object对象生成的次数, 当不传入times，则无限循环

返回一个迭代器，根据times重复生成object对象。

from itertools import repeat


str_data = "assd"
print(repeat(str_data))
print(list(repeat(str_data, 4)))


list_data = [1, 2, 4]
print(repeat(list_data))
print(list(repeat(list_data, 4)))

dict_data = {"a": 1, "b": 2}
print(repeat(dict_data))
print(list(repeat(dict_data, 4)))
#输出
repeat('assd')
['assd', 'assd', 'assd', 'assd']
repeat([1, 2, 4])
[[1, 2, 4], [1, 2, 4], [1, 2, 4], [1, 2, 4]]
repeat({'a': 1, 'b': 2})
[{'a': 1, 'b': 2}, {'a': 1, 'b': 2}, {'a': 1, 'b': 2}, {'a': 1, 'b': 2}]

stArmap(function, iterable)

function: 作用域迭代器对象元素的函数

iterable: 可迭代对象

返回一个迭代器, 将函数作用与可迭代对象的所有元素（所有元素必须要是可迭代对象，即使只有一个值，也需要使用可迭代对象包裹，例如元组(1, )）中,与map函数类似；当function参数与可迭代对象元素一致时，使用元组代替元素，例如pow(a, b)，对应的是[(2,3), (3,3)]。

map与starmap的区别在于，map我们一般会操作一个function只有一个参数的情况，starmap可以操作function多个参数的情况。

from itertools import starmap


list_data = [1, 2, 3, 4, 5]
list_data2 = [(1, 1), (2, 2), (3, 3), (4, 4), (5, 5)]
list_data3 = [(1,), (2,), (3,), (4,), (5,)]

print(list(starmap(lambda x, y: x + y, list_data2)))
print(list(map(lambda x: x * x, list_data)))
print(list(starmap(lambda x: x * x, list_data)))
print(list(starmap(lambda x: x * x, list_data3)))
#输出
[2, 4, 6, 8, 10]
[1, 4, 9, 16, 25]
Traceback (most recent call last):
  File "c:\Users\ts\Desktop\2022.7\2022.7.22\test.py", line 65, in <module>
    print(list(starmap(lambda x: x * x, list_data)))
TypeError: 'int' object is not iterable

takewhile(predicate, iterable)

predicate：判断条件，为真就返回

iterable: 可迭代对象

当predicate为真时返回元素，需要注意的是，当第一个元素不为True时，则后面的无论结果如何都不会返回，找的前多少个为True的元素。

from itertools import takewhile
#学习中遇到问题没人解答？小编创建了一个Python学习交流群：725638078

list_data = [1, 5, 4, 6, 2, 3]
print(list(takewhile(lambda x: x > 0, list_data)))
print(list(takewhile(lambda x: x > 1, list_data)))

zip_longest(*iterables, fillvalue=None)

iterables：可迭代对象

fillvalue：当长度超过时，缺省值、默认值，默认为None

返回迭代器, 可迭代对象元素一一对应生成元组，当两个可迭代对象长度不一致时，会按照最长的有元素输出并使用fillvalue补充，是zip的反向扩展，zip为最小长度输出。

from itertools import zip_longest

list_data = [1, 2, 3]
list_data2 = ["a", "b", "c", "d"]
print(list(zip_longest(list_data, list_data2, fillvalue="-")))
print(list(zip_longest(list_data, list_data2)))
print(list(zip(list_data, list_data2)))

[(1, 'a'), (2, 'b'), (3, 'c'), ('-', 'd')]
[(1, 'a'), (2, 'b'), (3, 'c'), (None, 'd')]
[(1, 'a'), (2, 'b'), (3, 'c')]

总结

accumulate(iterable: Iterable, func: None, initial:None)：

进行可迭代对象元素的累计运算，可以设置初始值，类似于reduce，相比较reduce,accumulate可以输出中间过程的值，reduce只能输出最后结果，且accumulate性能略好于reduce。

chain(*iterables)

依次输出迭代器中的元素，不会循环输出，有多少输出多少。当输出字典元素时，默认会输出字典的键；而对于列表，则相当于使用extend函数。

combinations(iterable: Iterable, r)：

抽取可迭代对象的子序列，其实就是排列组合，不过只返回有序、不重复的子序列，以元组形式呈现。

combinations_with_replacement(iterable: Iterable, r)

类似于combinations，从可迭代对象中提取子序列，但是返回的子序列是无序且不重复的，以元组的形式呈现。

compress(data: Iterable, selectors: Iterable)

根据selectors中的元素是否为True或者False返回可迭代对象的合法元素，selectors为str时，都为True，并且只会决定长度。

count(start, step)：

从start开始安装step不断生成元素，是无限循环的，最好控制输出个数或者使用next(),send()等获取、设置结果

cycle(iterable)

循环输出可迭代对象的元素，相当于对chain函数进行无限循环。建议控制输出数据的数量，或使用next()、send()等函数获取或设置返回结果。

dropwhile(predicate, iterable)

根据predicate是否为False来返回可迭代器元素，predicate可以为函数，返回的是第一个False及之后的所有元素，不管后面的元素是否为True或者False。这个函数适用于舍弃迭代器或可迭代对象的开头部分，比如在写入文件时忽略文档注释

filterfalse(predicate, iterable)

类似于filter方法，返回所有满足predicate条件的元素，作为一个可迭代对象。

groupby(iterable, key=None)

输出连续符合key要求的键值对，默认为x == x。

islice(iterable, stop)\islice(iterable, start, stop[, step])

对可迭代对象进行切片，和普通切片类似，但是这个不支持负数。这种方法适用于迭代对象的切片，比如你需要获取文件中的某几行内容

pairwise(iterable)

返回连续的重叠对象（两个元素），少于两个元素返回空，不返回。

permutations(iterable, r=None)

从可迭代对象中抽取子序列，与combinations类似，不过抽取的子序列是无序、可重复。

product(*iterables, repeat=1)

输出可迭代对象的笛卡尔积，类似于排序组合，不可重复,是两个或者多个可迭代对象进行操作，当是一个可迭代对象时，则返回元素，以元组形式返回。

repeat(object[, times])

重复返回object对象，默认时无限循环

starmap(function, iterable)

批量操作可迭代对象中的元素，操作的可迭代对象中的元素必须也要是可迭代对象，与map类似，但是可以对类似于多元素的元组进行操作。

takewhile(predicate, iterable)

返回前多少个predicate为True的元素，如果第一个为False，则直接输出一个空。

zip_longest(*iterables, fillvalue=None)

将可迭代对象中的元素一一对应，组成元组形式存储，与zip方法类似，不过zip是取最短的，而zip_longest是取最长的，缺少的使用缺省值。

1、背景已安装了 Python3.6.4，需要再安装 Python3.9 版本2、操作步骤（1）寻找当前 Python3.9 版本最新稳定版的子版本通过官网查找，目前为 3.9.18，下载到本地文件：Python-3.9.18.tg

2024-03-17 01:50:35

数据预处理的优化缺失值处理： interpolate() 函数：使用插值方法填充缺失值。 KNNImputer() 模块：通过 K 最近邻算法估计缺失值。 MICE 方法：通过多重插补创建多个数据集并组合结

2024-03-15 21:10:46

一、分析页面打开今日BBNews网址 https://news.bicido.com ，下拉选择【编程】栏目1.1、分析请求F12打开开发者模式，然后点击Network后点击任意一个请求，Ctrl+F开启搜索，输入标题

2024-03-15 21:03:08

很多人都听说过爬虫，我也不例外。曾看到别人编写的爬虫代码，虽然没有深入研究，但感觉非常强大。因此，今天我决定从零开始，花费仅5分钟学习入门爬虫技术，以后只需轻轻一爬就能查看

2024-03-15 21:01:49

&emsp;&emsp;本文介绍基于Python中ArcPy模块，对大量栅格遥感影像文件批量进行无效值（NoData值）填充的方法。&emsp;&emsp;在处理栅格图像文件时，我们经常会遇到图像中存在有无效

2024-03-15 21:00:14

pandas的DataFrame可以通过设置参数使得在jupyter notebook中显示的更加美观，
但是，将DataFrame的数据导出excel时，却只能以默认最朴素的方式将数据写入excel。本文介绍一种简

2024-03-15 20:56:37

我们在使用pandas处理完数据之后，最终总是要把数据作为一个文件保存下来，
那么，保存数据最常用的文件是什么呢？
我想大部分人一定会选择csv或者excel。刚接触数据分析时，我也是这

2024-03-15 20:55:50

Pandas无疑是我们数据分析时一个不可或缺的工具，它以其强大的数据处理能力、灵活的数据结构以及易于上手的API赢得了广大数据分析师和机器学习工程师的喜爱。然而，随着数据量

2024-03-15 00:55:56

1. 本篇文章目标将下面的excel中的寄存器表单读入并构建一个字典
2. openpyxl的各种基本使用方法2.1 打开工作簿wb = openpyxl.load_workbook('test_workbook.xlsx'

2024-03-12 23:59:32

F-String（格式化字符串字面值）是在Python 3.6中引入的，它是一种非常强大且灵活的字符串格式化方法。它允许你在字符串中嵌入表达式，这些表达式在运行时会被求值并转换为字符串，

2024-03-12 12:07:02

building-a-simple-redis-server-with-python前几天我想到,写一个简单的东西会很整洁雷迪斯-像数据库服务器。虽然我有很多 WSGI应用程序的经验,数据库服务器展示了一种新

2024-03-12 12:04:50

人工智能时代，最需要学习的编程语言是：python 。笔者是个 python 小白，昨天花了两个小时，第一次成功运行起来 python 项目。项目是 powerpoint-extractor ，可以将 ppt 文件中的

2024-03-11 18:44:06

一、介绍在上节 Python实现企业微信上下班自动打卡程序内容之后，我们继续优化自动打卡程序。接下来增加如下内容：实现打卡时间随机范围处理节假日不打卡的情况实现定时调度

2024-03-11 18:35:32

本文介绍基于Python中whitebox模块，对大量长时间序列栅格遥感影像的每一个像元进行忽略NoData值的多时序平均值求取。在文章Python ArcPy批量计算多时相遥感影像的各像元平均

2024-03-09 22:37:42

最近用到百度飞桨的 PaddleOCR，研究了一下PaddleOCR的服务化部署，简单记录一些部署过程和碰到的问题。基础环境 paddlepaddle 2.5.2 python 3.7 paddlehub 2.1.0 PaddleOCR 2.

2024-03-09 22:30:58

前言Python 是一门上手非常快的语言，学习python这门编程语言达到能够正常使用的程度，需要掌握的点包括：语言基础特性数据类型流程控制函数调用面向对象模块与包下面从这6

2024-03-08 22:46:37

Python作为一门灵活、充满技巧的语言，有着很多奇技淫巧，今天小编就跟大家分享一下在平时工作中所积累的技巧，这里面既有语法上的技巧，也有库函数的应用，可以帮助大家在平时的工作

2024-03-08 22:42:14

上一篇文章Python中那些简单又好用的特性和用法发出后，群里的小伙伴又给补充了几个好用的用法，结合生产实用经验汇总整理如下，各位看官如有需要请自取反射，反射是一种机制，可以

2024-03-08 22:37:59

一般来说，我们先用pandas分析数据，然后用matplotlib之类的可视化库来显示分析结果。
而pandas库中有一个强大的工具--plot函数，可以使数据可视化变得简单而高效。1. plot 函数

2024-03-08 22:36:32

pandas中的cut函数可将一维数据按照给定的区间进行分组，并为每个值分配对应的标签。
其主要功能是将连续的数值数据转化为离散的分组数据，方便进行分析和统计。1. 数据准备下

2024-03-07 01:23:55

Python作为我的主力语言帮助我开发了许多DevOps运维自动化系统，这篇文章总结几个我在编写Python代码过程中用到的几个简单又好用的特性和用法，这些特性和用法可以帮助我们更高

2024-03-07 01:22:01

一文搞懂如何自己写一个Python库你是否曾想过为自己的Python项目编写一个库，以便在不同项目中重复使用代码？并且能在PyPI仓库中发布，并通过pip install 库名来安装使用编写Pyth

2024-03-07 01:21:09

高级优化：字节码优化Cpython 解释器将 Python 源代码编译为字节码，然后由虚拟机执行。字节码优化涉及修改字节码以提高性能。常见的优化技术包括：import disdef fib(n):if n <

2024-03-05 23:19:26

与 C/C++ 的互操作Cpython 可以直接调用 C/C++ 代码，因为它通过 CPython 解释器内部的 C 接口公开了一个 CPython api。这允许开发人员使用 Python 访问 C/c++ 库，从而利用它

2024-03-05 23:16:12

处理大量数据时，经常需要对数据进行分组和汇总，groupby为我们提供了一种简洁、高效的方式来实现这些操作，从而简化了数据分析的流程。1. 分组聚合是什么分组是指根据一个或多个

2024-03-05 23:07:26

最近，我在 Python 潮流周刊中分享了一个超级火爆的项目，这还不到一个月，它在 Github 上已经拿下了 8K star 的亮眼成绩，可见其受欢迎程度极高！国内还未见有更多消息，我趁着周末把

2024-03-05 23:06:19

&emsp;&emsp;本文介绍基于Python中ArcPy模块，实现基于栅格图像批量裁剪栅格图像，同时对齐各个栅格图像的空间范围，统一其各自行数与列数的方法。&emsp;&emsp;首先明确一下我们

2024-03-04 22:58:28

使用 pandas 进行数据分析时，第一步就是读取文件。
在平时学习和练习的过程中，用到的数据量不会太大，所以读取文件的步骤往往会被我们忽视。然而，在实际场景中，面对十万，百万级别

2024-03-04 22:54:15

在进行统计分析时，pandas提供了多种工具来帮助我们理解数据。
pandas提供了多个聚合函数，其中包括均值、标准差、最大值、最小值等等。
此外，pandas还可以进行基于列的统计分析

2024-03-04 22:53:49

在pandas中，索引（index）是用于访问数据的关键。
它为数据提供了基于标签的访问能力，类似于字典，可以根据标签查找和访问数据。而pandas的轴（axis）是指数据表中的一个维度，可以理解为

2024-03-04 22:53:23

2020-10-21

2021-03-02

2020-05-07

2020-05-26

2021-01-13

2021-04-02

2020-05-09

2020-05-10

2020-10-21

Python中itertools模块如何使用

chAIn(*iterables)

combinations(iterable: Iterable, r)

combinations_with_replacement(iterable: Iterable, r)

compress(data: Iterable, selectors: Iterable)

count(start, step)

cycle(iterable)

dropwhile(predicate, iterable)

filterfalse(predicate, iterable)

groupby(iterable, key=None)

islice(iterable, stop)\islice(iterable, start, stop[, step])

pairwise(iterable)

permutations(iterable, r=None)

product(*iterables, repeat=1)

repeat(object[, times])

stArmap(function, iterable)

takewhile(predicate, iterable)

zip_longest(*iterables, fillvalue=None)

总结

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道