随机数有三个性质
随机性:随机数应该不存在统计学偏差,是完全杂乱的数列。
不可预测性:不能从过去的序列推测出下一个出现的数。
不可重现性:除非数列保存下来,否则不能重现相同的数列。
根据这三个性质我们就将随机数分为三个类:
伪随机 (PRNG)、密码学安全的伪随机 (CSPRNG) 与真随机 (TRNG)
一、Pseudo-Random Number Generators(PRNG) 是一种数字序列的生成算法,它生成出的数字序列的统计学属性跟真正的随机数序列非常相似,但它生成的伪随机数序列并不是真正的随机数序列!因为该序列完全依赖于提供给 PRNG 的初始值,这个值被称为 PRNG 的种子。
算法流程如下,算法的每次迭代都生成出一个新的伪随机数:
我们以python为例,来写一个python的prng伪随机数
import hmac, hashlib二、Cryptography Secure Random Number Generators(CSPRNG) 是一种适用于密码学领域的 PRNG,一个 PRNG 如果能够具备如下两个条件,它就是一个 CSPRNG:
def random_number_generator(seed: bytes, max_num: int):
state = seed
counter = 0
while True:
state = hmac.new(state, bytes(counter), hashlib.sha1).digest()
counter += 1
# 这里取余实际上是压缩了信息,某种程度上说,这可以保证内部的真实状态 state 不被逆向出来
yield int.from_bytes(state, byteorder="big") % max_num
# 测试下,计算 20 个 100 以内的随机数
gen = random_number_generator(b"abc", 100)
print([next(gen) for _ in range(20)])
# => [71, 41, 52, 18, 51, 14, 58, 30, 70, 20, 59, 93, 3, 10, 81, 63, 48, 67, 18, 36]
随机性和不可预测性
python实现CSPRNG代码
#!/usr/local/python3/bin/python3
# -*- coding: utf-8 -*
import secrets
import string
chars = string.digits + "your_custom_-content" + string.ascii_letters
def random_string(length: int):
"""生成随机字符串"""
# 注意,这里不应该使用 random 库!而应该使用 secrets
code = "".join(secrets.choice(chars) for _ in range(length))
return code
print(random_string(24))
还可以通过os.urandom()实现
#!/usr/local/python3/bin/python3
# -*- coding: utf-8 -*
# Python program to explain os.urandom() method
# importing os module
import os
# Declaring size
size = 5
# Using os.urandom() method
result = os.urandom(size)
# Print the random bytes string
# Output will be different everytime
print(result)
再看看其他编程语言的CSPRNG库
Java: java.security.SecureRandom
Python: secrets 库或者 os.urandom()
C#: System.Security.Cryptography.RandomNumberGenerator.Create()
BfwJavascript 客户端可使用 window.crypto.getRandomValues(Uint8Array),服务端可使用 crypto.randomBytes()
好了,伪随机 (PRNG)、密码学安全的伪随机 (CSPRNG)都说完了,接下来就是真随机TRNG
三、true random number generator简称(TRNG)真随机生成器
他满足了不可预测性、随机性与不可重现性,就是任何时候,用这个生成器生成的随机数都是唯一的,不重复,我们以python为例写一个真随机数程序。
我们结合时间戳和csprng来实现一个真随机数
#!/usr/local/python3/bin/python3·有人说python中还有一个uuid库,其中的uuid1可以生成一个全球唯一的id,他是不是真随机呢,其实uuid1是基于MAC地址,时间戳,随机数来生成唯一数,也可以算是一个真随机数。
# -*- coding: utf-8 -*
import time
import secrets
import string
chars = string.digits + "your_custom_-content" + string.ascii_letters
def random_string(length: int):
t = str(time.time())
"""生成随机字符串"""
# 注意,这里不应该使用 random 库!而应该使用 secrets
code = "".join(secrets.choice(chars) for _ in range(length))
return t+code
print(random_string(24))
#!/usr/local/python3/bin/python3
# -*- coding: utf-8 -*
import uuid
name = "wiki"
namespace = "bfw"
'''基于MAC地址,时间戳,随机数来生成唯一的uuid
基于MAC地址,时间戳,随机数来生成唯一的uuid,可以保证全球范围内的唯一性。
'''
print(uuid.uuid1())
'''
通过计算一个命名空间和名字的md5散列值来给出一个uuid,所以可以保证命名空间中的
不同名字具有不同的uuid,但是相同的名字就是相同的uuid了。
namespace并不是一个自己手动指定的字符串或其他量,而是在uuid模块中本身给出的一些值。
比如uuid.NAMESPACE_DNS,uuid.NAMESPACE_OID,uuid.NAMESPACE_OID这些值。
这些值本身也是UUID对象,根据一定的规则计算得出。
'''
print(uuid.uuid3(uuid.NAMESPACE_DNS,name))
'''
通过伪随机数得到uuid,是有一定概率重复的
'''
print(uuid.uuid4())
'''
和uuid3基本相同,只不过采用的散列算法是sha1
'''
print(uuid.uuid5(uuid.NAMESPACE_DNS,name))
网友回复