关于数据安全问题的若干看法

https://github.com/CJMaxWell2013/EncryptionIntroduced.git

一、关于web或者app应用目前大致主要面临的安全问题

1、数据篡改（签名）

2、重放攻击（时间戳）

3、非法参数提交（校验参数）

4、数据偷窥（https）

二、原理分析和解决方案

服务器域名：http://www.jescard.com

端口号：user/getUserInfo

假设基础参数列表：userId、detailType，其中

userId代表用户唯一标识

detailType代表用户页面的基本模块，0代表基本信息、1代表工作经历、2代表教育经历等等

基本示例：

http://www.jescard.com/user/getUserInfo?userId=1&detailType=0

2.1数据篡改攻防

目前这种情况下有一个显著的安全隐患就是我们可以修改

userId=2、3、4......

来遍历得到其余的所有用户信息，主要原因由于我们userId是真实的数据库的用户表的主键，主键一般都是正整数类型的数字，所以爬虫可以通过修改这个参数的值来进行爬取。

解决办法1：避免主键来作为参数传递，这种方式多用于三方授权，三方授权通常都不会给用户直接的数据库中的主键，而是通过一种不可逆的算法来生成一个token来给客户端使用，防止通过这种直接遍历主键id获取别的用户的信息。

解决办法2：采用签名的方法，前后端约定一个秘钥，假设privateKey=“123456”，用这个privateKey来给userId做签名(mySign) , 假设使用目前计算机主流使用的md5，则过程如下前端通过userId+privateKey生成签名字符串mySign

1 + 123456 ——经过md5——>  ASDFHGGGASDFHGGGASDFHGGGASDFHGGG

客户端发送请求为

http://www.jescard.com/user/getUserInfo?userId=1&detailType=0&mySign=ASDFHGGGASDFHGGGASDFHGGGASDFHGGG

服务端在接受userId参数以后，以后也按照约定userId+privateKey来生成签名severSign，如果爬虫userId被修改了为了2，那么由于md5加密的唯一性

2 + 123456 ——经过md5——>  EFGFHGGGASDFHGKKKKKGGGASDFHGGGKKK

则服务端通过生成的severSign和mySign的对比就可以发现不同，从而拒绝爬虫提取数据。

但是这个签名只是对了userId字段做了签名，并没有将detailType字段纳入签名之中，所以detailType字段并未受到签名的保护

爬虫依然可以通过修改detailType的值来爬取它已知用户下的用户各个模块的信息。

这也可以算是一个潜在的危险。

综述：签名防止数据篡改，保证了访问的合法性，建议

将所有的请求参数按照一定的排列顺序（ASCII）+ privateKey来签名

这样爬虫只要篡改了其中任何一段信息都会导致severSign和客户端传来的mySign不匹配，从而达到拒止作用。

2.2重放攻击

现在数据篡改解决了，但是爬虫着急了

http://www.jescard.com/user/getUserInfo?userId=1&detailType=0&mySign=ASDFHGGGASDFHGGGASDFHGGGASDFHGGG

用户标识为userId=2、3、4…..不能被直接网络请求提取了。

但是，如果仔细观察就会发现，我每次都可拿这个签名验证过的url，可以重复的不断的调用获取该指定用户的信息即userId=1的那个用户。

邪恶的爬虫者就可能会无限制、高频率的发起这个请求来让你服务器不断的响应该请求，从而达到拖累你服务器来搞破坏。

这个就是一个重放攻击的过程。（你不让我爬，我也不让你好受，我就重复发送一个请求，你奈我何~~~）

解决办法1：ip或者deviceId（客户端的设备id）来限制访问频率，这个比较常见，在反爬虫中常见的手段，但是这种手段也是可以被破解的比如我使用多个代理ip缓存池就可以绕过你的ip防火墙达到目的。

解决办法2：添加时间戳timestamp字段，UNIX时间戳用的是世界协调时定义的是时间间隔，注意是时间间隔，避免了时区的问题！排除早期的32位存储争议，现在的多为double类型的64位存储。详见

https://en.wikipedia.org/wiki/Unix_time

客户端传递

timestamp=1503333333.6669(单位秒)

服务端收到该时间戳的时候要获取自己机器上的unix时间戳

severTimestamp=1503333334.4567

那么我们就可以对比这两个时间戳的差值，是否小于我们响应预定义超时的最大时间

maxOvertime = 10.0

绝对值(severTimestamp-timestamp) < maxOvertime

如果验证通过则放行，如果验证不通过则说明超过了时效。即使是2.1中签名过的合法的访问，超过了有效时间间隔也是不被允许的。

特别注意，时间戳作为新的字段，也必须纳入到2.1的建议中去，将其签名保护起来，否则可能会造成签名复用的时间戳动态变化的重放攻击！！！

有的应用为了增加破解难度综合2.1的建议，可采取多次md5组合来加密,这里我就随便写一个演示例子:

md5(md5(将所有的请求参数按照一定的排列顺序（ASCII）+ privateKey来签名） + 时间戳)

一些自定义的算法加密过程误区

有些时候我们根据业务需求会设计一些自定义的算法，有时候我们会说，我只要不暴露我的算法过程，我这个加密就是不可破解的。

因为只要我不告诉你加密过程，你是无法钻到我的脑子里面去猜到我的加密过程的，那么对加密结果也是不可测的。

这是一个典型的误区，之所以进行加密，是因为我们假设服务端建立在不信任客户端的前提下的，

而所有的加密结果都需要经过服务端校验获取信任的。

意味着只要服务端信任了客户端，我们的加密就失效了。这句话很晦涩哈，举个例子吧！

假设有某PersonA就职于统计SDK设计方，创建了一个算法A用于加密！

模拟攻击方--黑客B，其完全不知道PersonA的算法，对于PersonA的加密结果也是不可测的！

黑客B的目标是从A接口中获取所有的用户信息！A接口如下：

http://www.umeng.com/user/getUserInfo?userId=1&detailType=0

但是PersonA在操作过程中只对整个公司业务底层的http请求的公共参数publicParameter进行了加密，

对于统计SDK设计方，比如友盟统计，每个统计接口中必传递的参数是

时间戳是timestamp，人家做统计嘛这个参数肯定是需要的。

publicParameter:99xxyy9xx9tt98xxx + PrivateKey ---经过算法A处理---> resultSign:xxxxyyyy

http://www.umeng.com/user/getUserInfo?userId=1&detailType=0&publicParameter=99xxyy9xx9tt98xxx&resultSign=xxxxyyyy

通过目前来如果不验证时效性，黑客B可以通过遍历直接userId来获取所有的用户信息，这点是畅通无阻的。我们也假设这个PersonA验证了！！！

黑客B经过仔细研究和尝试即可发现一定的规律：

1、签名具有时效性！并测出失效间隔！

2.“B接口的publicParameter和resultSign签名发送的合法请求在失效期内可以放到A接口中使用！“

这下就简单了，为了通过接口A不间断的爬取这个库中的所有用户信息，

黑客B就模拟多个慢频率的客户端调用B接口甚至是C接口中的合法网络请求，在小于PersonA设置的时效间隔范围内，

将参数中的publicParameter和resultSign筛选出建立一个缓冲签名池，

从池中筛选出新的有效签名输送给A接口，获得了服务器的信任。

这样黑客B就能不必中断A接口的爬取过程，源源不断的来采集用户库中的私密信息。

这个就是一个典型的只对公共参数做校验而被黑客B利用的重放攻击案例。

这个过程本质上是攻击者利用网络监听或者其他方式盗取认证凭据，之后再把它重新发给认证服务器。

（https://baike.baidu.com/item/重放攻击/2229240?fr=aladdin#reference-[3]-1569933-wrap）

通过重放签名来获取服务器的信任从而窃取用户库的私密信息。

在这个案例中加密算法A和秘钥根本没有起到任何作用。

因为PersonA设计的时候这个加密参数是公共参数publicParameter

意味着同一时间所有的接口的验证都是一样的、可以互用！

这个潜在的漏洞，黑客B在完全不用知道秘钥，同时也不需要知道加密算法A的算法过程！即可破之！

这正也充分说明了未被签名的字段如2.1所说，其一般情况下是未受保护，且可被篡改的。

所以，PersonA仅对时间戳签名是无法保证userId等其余参数不被篡改的。

成熟的算法参考(UM消息推送示例)

我认为通过2.1和2.2两个部分得到的前后端协调防御的办法，基本上可以满足大部分场合的需求了。

主要过程如上图所示，关于友盟消息系统的加密过程详细参考文档

http://dev.umeng.com/push/ios/api-doc#4_10

他的加密原理也是按照上面2.1和2.2分析的思路来的。

2.3非法提交参数

这个服务端开发的打交道比较多，比如SQL注入，XSS攻击很多…

我本人对SQL注入略有了解，简单来说，咱们在web表单中提交的参数最终转化成sql语句，而条件过滤基本是借助where后面的条件来实现的，正常情况下如果where后面的条件为真就可以提取到对应的信息。

一些游手好闲的黑客就设法通过提交表单的时候会注入一些扩大搜索范围的sql关键字，来使得where后面的条件和你传入的意图条件取并集这样扩大你的搜索范围或者让where后的条件始终是真的

这样一下子就获取了很多额外的大量数据。

注：我这个在自己的mysql下随便写的示例，表结构如下

假设我们要查询数据库中工作id值为1的工作信息

http://localhost:8080/queryJob?jobid=1

sql示意代码如下：

SELECT     job_id, job_describle, job_name, job_salary
FROM        jobs
WHERE     job_id = 1

所谓sql注入

http://localhost:8080/queryJob?jobid=1or1=1

假设我们要获取jobs表中的所有数据，而且必须保留WHERE语句，那我们只要确保WHERE为TRUE就OK了，sql示意代码如下：

SELECT     job_id, job_describle, job_name, job_salary
FROM        jobs
WHERE     job_id=1 OR 1=1

上面我们使得WHERE恒真，所以该查询中WHERE已经不起作用了，其查询结果等同于以下sql语句：

SELECT    job_id, job_describle, job_name, job_salary
FROM       jobs

这样我们一下子就提取了jobs表中的所有信息。

解决方案：对于这种方式的话我觉得后端那边对查询的条件做检查判断更为合适。

对于别的攻击，我也没有实验过不敢乱说，我也自己找了几篇博客看了看

http://netsecurity.51cto.com/art/201405/440233.htm

http://netsecurity.51cto.com/art/201408/448305_all.htm

大家有兴趣可以自己研究研究吧。

2.4数据偷窥

前面说的http协议传输层传输的数据基本上都是明文的，这个虽然可以在服务端签名验证或者验证合法性和时效性，

但是没办法保证用户的数据在传输的过程中不被偷窥！

http阶段解决方案：对密码等用户敏感信息进行加密传输,不能进行明文传递，但是这个任然无法避免被中间三方抓包观察加密后的信息。

升级https解决方案：https出现就是在传输层对数据进行加密防止三方偷窥（而不是客户端和服务端）。

如果你想试验，前端iOS都可以使用”青花瓷“软件抓包，而且是看到的数据是明文的，教程如下：

http://www.jianshu.com/p/6b241a35813f

http://blog.csdn.net/lea__dongyang/article/details/73294751

一般的https都是采用CA权威机构授权的证书来给web端和app应用于加密数据的传输层。免费的也有:

https://www.qcloud.com/document/product/400/8422

也有安全级别较高的，不过费用也比较昂贵。

https://www.qcloud.com/product/ssl

iOS 10以后受信任证书存储区中包含三类证书，详细可参考这边官方链接

https://support.apple.com/zh-cn/HT207177

具体比较http和https的不同可参考

http://www.mahaixiang.cn/internet/1233.html

三、小结

以上是本人对数据安全的一些理解，如果您觉得过程中有任何不正确的地方，请在github上给我留言。

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
Snapshots		Snapshots
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

关于数据安全问题的若干看法

一、关于web或者app应用目前大致主要面临的安全问题

二、原理分析和解决方案

2.1数据篡改攻防

2.2重放攻击

2.3非法提交参数

2.4数据偷窥

三、小结

License

About

Uh oh!

Releases

Packages

License

CJMaxWell2013/EncryptionIntroduced

Folders and files

Latest commit

History

Repository files navigation

关于数据安全问题的若干看法

一、关于web或者app应用目前大致主要面临的安全问题

二、原理分析和解决方案

2.1数据篡改攻防

2.2重放攻击

2.3非法提交参数

2.4数据偷窥

三、小结

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Packages