Skip to content

Latest commit

 

History

History
110 lines (106 loc) · 16 KB

README.md

File metadata and controls

110 lines (106 loc) · 16 KB

Python 编程练习

弟弟学习 Python 没啥入门的练习, 直接做项目估计搞不来, 还是一点一点练吧, 通过测试来检验是否代码敲对了

另外顺便作为自己千里码练习的地方了...

题目清单

  • 千里码
    • 题目 1 -【第2333个能被2或者被3整除的正整数是多少?】
    • 题目 2 -【自由之门】,翻墙一下子就有了: https://en.wikipedia.org/wiki/Great_Wall_of_China
    • 题目 3 -【English】,读起来没啥压力:to learn more English
    • 题目 4 -【Get&Post】,比起用 js,自己还是比较喜欢用 Python 解决,手动提交一下,把 cookie 拿下来后用 requests 库 POST 掉,详看对应文件夹下的 solve.py
    • 题目 5 -【访客统计】,Python 脚本加正则解决了
    • 题目 6 -【IP】,ping 一下就得到 IP 地址了
    • 题目 7 -【Cookie】,chrome 的开发者工具, 检查一下页面 7530, 发现了一个 cookie 存在 Url 编码, 解码一下, 得到一串字符, 其实答案就 4 个字符...还以为要解密那一堆, 不过发现每次刷新都不一样果断知道答案了
    • 题目 8 -【数据脱敏】,把 md5 放在 Hash Toolkit 一下子就出来了
    • 题目 10 -【Basic CSS】,幸好看了讨论区,是 div1 里的第一个框改为 32px 161px,div2 里的第二个框改为 49px 40px
    • 题目 11 - 【跑马灯】,看了讨论区,找到 lottery.marquee.js,把 alert(de.toString(CryptoJS.enc.Utf8)); 前的 if 去掉就行,注意在 chrome 下改完得按 cmd+s(macOS) 保存,界面会变红,这样才能生效
    • 题目 12 - 【商品数量-1】,用 Python 脚本解决了,幸好数量不多,初始化为 1000 了
    • 题目 13 - 【商品数量-2】,用 Python,同样的脚本,慢了许多,最后迫不得已用 gmpy2 库加速了一下,还是挺久,几分钟内能跑出来
    • 题目 14 - 【热点营销-1】,用 Python 脚本, 参考讨论区学习了图论, 很不错
    • 题目 15 - 【热点营销-2】,同用 Python 脚本, 参考讨论区, 知道了在上一题的基础上还要再考虑孤立结点
    • 题目 16 - 【断点续传】,用 Python 脚本, 参考学长的文章知道了有这么一个 Range: bytes=0-20 的 HTTP 头,剩下的就是 requests 的事情了
    • 题目 17 - 【我从哪里来】,自己是用 Chrome 的插件【modify-http-headers】实现修改 HTTP 头的 Referer 字段,后来看评论区推荐了神器 Fiddler,虽然没试
    • 题目 18 - 【彩虹】,mac 自带的工具:数码测色计,选择【显示原生值】,得到 16 进制数后转换一下就可以了
    • 题目 19 - 【以图搜图-1】,直接上谷歌识图
    • 题目 21 - 【文件管理】,用 Python 脚本遍历一下文件夹即可
    • 题目 22 - 【(未过)Git】,Fork 一下,直接在 GitHub 上编辑 readme,然后保存到自己 fork 的分支后,再在 GitHub 页面上 Pull Request
    • 题目 23 - 【豆瓣评分爬取】,用 Python 脚本过了,注意是爬取前 166 部,用的 requests + bs4 库
    • 题目 24 - 【Robots协议】,用 chrome 插件改下 HTTP 头就可以了
    • 题目 25 - 【老王装货】,用 Python 脚本过了, 学习了一下背包问题
    • 题目 26 - 【动态爬虫】,用 Python 脚本找出了后面几个网页的排序, 至于 1 和 2 和 10 频率太接近了, 所以这三个是猜的, 最后对了
    • 题目 27 - 【我要建站-1】,自己有个 VPS,放个 html,里面只写自己的用户名,然后过了
    • 题目 28 - 【我要建站-2】,在自己的 Django 博客上新建了个 HTML 来实现这个功能, 顺带学习了一下 Django GET 传参数
    • 题目 30 - 【逆向工程-begin】,在讨论区找到了个在线反编译 swf 文件的网站,然后找到了这么一段话:if (_root.lvl >= 15) { xx = 18; aa = 17; xx = xx * (29 * aa); xx = xx + (5423 + aa); xx = xx * 11; xx = xx - (77 * aa); lvltext = lvltext + (", y o u r a n s w e r : " + xx); },按照代码计算一下 xx 的值就可以出答案了。还有人推荐工具:JPEXS Free Flash Decompiler
    • 题目 31 - 【正则表达式】,考验一下写正则的能力,用 Python 的 re 库自测通过然后提交的,发现答案会提示哪个匹配错了,很不错。顺带熟悉了一下正则进行或操作
    • 题目 32 - 【同图搜索-1】,看了讨论区发现有 imageHash 库,太强大了。。。用 Python 一次性通过了
    • 题目 33 - 【历史网页爬取】,用了讨论区推荐的 wayback machine 网站解决的
    • 题目 34 - 【喜刷刷】,题目不难,就是耗时,遍历每一个数字计算 hash 值,看是否满足前 6 位都是 0 的要求,满足的话就提交。最终用 Python 脚本解决的,顺带学习了一下多进程还有进程池的知识
    • 题目 37 - 【访客统计2】,直接在 cpp 上更改, 看了讨论区用 char 数组来计数, 话说压根没花多少内存和时间就能跑完了啊。。。
    • 题目 38 - 【Java反编译】,先到在线反编译 Java 网站反编译出一个几千行的代码, 然后看讨论区发现 java性能分析线程调优神器 jvisualvm, 直接使用它就可以了, 不过讨论区说是要分析 CPU, 我是通过 IDEA 的终端运行脚本: java Branches, 之后跑去 Profiler 看一下, 发现循环的 3 个函数: eLlCsy。看到两个相同的数异或应该是 0, 把 3 个函数都改改就跑出来了
    • 题目 39 - 【Vim】,按照题目给的那一串打完,可以得到:the answer is xxxxx,把 xxxxx 提交上去就对了
    • 题目 40 - 【缺失的后缀】,利用强大的命令 file 就可以解决了,第一次使用 file 得到:file noname noname: RAR archive data, v1d, os: Win32,RAR 文件,解压就是了;第二次得到:0b55b319ebc4b745d931e035cefc1e178a82156: Zip archive data, at least v2.0 to extract,zip 文件,继续解压;第三次:0b55b319ebc4b745d931e035cefc1e178a82156f: PC bitmap, Windows 3.x format, 600 x 600 x 32,bmp 图像文件,打开可以看到图片中的文字,会显示答案的
    • 题目 41 - 【打车匹配】,看不懂题目,不知道该用什么算法,结果看讨论区提到了匈牙利算法,而且 Python 还有对应的库:munkres,于是直接用这个库过了
    • 题目 42 - 【新词发现】,思路不难, 不过自己居然是先看讨论区的算法再自己写的, 这样不好- -!用了 Python 的 Counter 类来帮助实现的。
    • 题目 45 - 【HTML5】,使用 Chrome 的 F12 开发者工具, 到 Application 下可以看到
    • 题目 46 - 【代理IP】,自己是用 requests 库解决的, 网上给了 curl 的方法, 挺不错的: curl -x 121.201.63.168:8080 http://www.qlcoder.com/train/proxy
    • 题目 47 - 【访客统计3】,使用了讨论区的解法, 记得算出最后的结果还得乘以 64, 自己的答案是: 35157520640
    • 题目 48 - 【OpenSSL】,本来打算用 PyCrypto 解决的, 但是发现给的信息太少了, 用的什么加密模式? IV 怎么拿都不清楚。。。于是还是按照讨论区使用 OpenSSL 吧: openssl bf -d -in blowfish.data -out test.txt
    • 题目 51 - 【Smaller than Smaller】,在线 BWT 工具:http://kodu.ut.ee/~lipmaa/research/bwt/,把题目给的字符串,前后加上 ^| 然后放上去跑,得到结果 NNNBBBBBBBBBBBNANNNNNBBBBAA^AAAAAAAAAAAAAHAAAAAAAAA|H,再手工压缩一下就可以了
    • 题目 52 - 【BGM】,看了讨论区,用了 mpv 的循环播放功能 + 手机下了 SoundHound APP 解决的,突然觉得这 APP 有点逆天,当然仅针对英文歌曲
    • 题目 53 - 【Bigger than Bigger】,用 Wiki 上给的快速 Python 算法解决的,用慢的那个跑了半天没跑出来,解决之后还是靠百度第一篇得到的搜索结果
    • 题目 54 - 【TOR】,到官网下载 TOR 浏览器,然后按照引导配置代理连上 TOR 网络即可,接着访问那个网站获得对应的名字提交就对了
    • 题目 55 - 【QR Code】,看了讨论区给的网址,贴图片地址之后就可以解析出来了
    • 题目 56 - 【Smallest】,依旧是考验 BWT 算法的,但是上面一道题的网站不能用了,文本太长。没办法,只好自己找实现代码了,发现 stackoverflow 已经有答案了。把算法实现复制了下来,再加上 Pypy3 一下子就跑出结果来了
    • 题目 58 - 【抓包】,自己按照提示用 Wireshark 看到 HTTP 请求,直接把域名提交就 OK 了,看评论区有人推荐用 less 工具,结果发现确实能看到文本内容。其实就是二进制逆向查看文本
    • 题目 59 - 【我要建站-3】,新建了个临时的 django,开了内网穿透,过了,这题没啥知识点
    • 题目 61 - 【历史密文-1】,最终结论: 自己的两种解法, 一种是栅栏密码, 另一种是 rail fence, 应该用栅栏密码解决, 但是自己的栅栏密码好像有问题
    • 题目 63 - 【无边界地图】,自己按照讨论区写了脚本,跑了 2k 轮确定了答案,话说为啥到最后全是 116 了,怀疑是不是有 BUG?
    • 题目 65 - 【可视化-1】,本来想趁机研究一下 matlabplotlib 库的,看了半天头痛就放弃了,还是采用画点的方法吧,不过自己已经懒得写代码而是直接复制别人的代码了,堕落啊。。
    • 题目 66 - 【Base64】,看了讨论区才知道要保存为图片,解码后保存为图片再打开就可以看到答案了。
    • 题目 70 - 【历史密文-2】,看 Python 代码写个逆运算,放服务器跑了一晚上才出来结果,[122, 34, 79, 23],不知道是 Python 真慢还是我打印太多导致变慢的。。。
    • 题目 78 - 【JSON&XML】,看了讨论区, 知道得加上 <root>, 于是加完之后再去在线网站转一下, 过了
    • 题目 81 - 【数据挖掘-Warmup】,数据挖掘一点不会, 看了讨论区贴出来的代码完成了加载数据一直到使用朴素贝叶斯进行预测的过程, 不过准确率只有 80.5% 跟讨论区贴代码的人一致
    • 题目 84 - 【隐写术-1】,自己是使用 Stegsolve 这个工具解决的, 看讨论区好多用 Python 的 PIL 库解决的
    • 题目 90 - 【数据挖掘-2】,跟数据挖掘 1 用的是几乎一模一样的代码, 本来想用 auto-sklearn 的但是安装之后跑不起来, 没定位出原因。。。
    • 题目 92 - 【ABTest】,看了讨论区, 知道要改 cookie 中的 uuid, 改成 c 是求哈希值的, 求完哈希值提交就对了
    • 题目 94 - 【GDB】,学习一下 gdb 知识,前后试了 OD 调 exe 说是非法 PE 文件,用 mac 版本也是有莫名其妙的错误,只好跑到 Linux 下运行了,还真的一下调试出来了,info threads 后依次 thread 8 每个进程直到 8,看函数名知道答案了
    • 题目 96 - 【拟合-1】,看讨论区的答案解决的, 主要是学习一下 numpy.polyfit 以及 numpy.loadtxt 的使用
    • 题目 97 - 【拟合-2】,改一下自由度就可以过了
    • 题目 98 - 【搜索提示-1】,先后用了 Python 和 Ruby, Python 只有 590+ 准确, Ruby 直接跑好像 630+, 然后手动改了 5 个地方:ɑ->a、u:->v、r->er、女主播、zhei->zhe 之后就刚好过了
    • 题目 101 - 【PNG-1】,讨论区有人用 pngcheck 检查出了 IDAT 错误以及对应的 crc32, 但是这样还是没法快速定位出要修改的长度, 最终自己是用脚本解决的, 包括定位的函数以及循环 2**32 判断正确长度
    • 题目 102 - 【序列化】,学习了使用 Python3 + protobuf3, 但是现在只会反序列化, 不会进行序列化操作, 悲剧了= =
    • 题目 106 - 【BMP】,看着 wiki 一个字段一个字段地解析 BMP, 然后讨论区给的提示是把像素数组全都按 7 位隔开转成 8 位, 同时修改色深, 之后就可以打开图片了
    • 题目 110 - 【时间线-1】,自己写的跑得太慢了, 参考讨论区改了个快一点的版本, 还是需要十几分钟来跑, 然后居然发现了 Python2 的 random 数值和 Python3 的不一样, 必须得用 Python2 来产生数据, 好吧
    • 题目 113 - 【File in File】,按照题目给的格式按字节读取文件即可, 其实最好学一下 struct 库来解析文件, 以后有机会再试吧
    • 题目 115 - 【抓包-2】,看了讨论区, 学会了导出的招式, 但问题是用 macOS 下的 WireShark 导出的图片有问题, 于是还是换成 win7x64 下成功导出了
    • 题目 120 - 【RSA】,RSA 爆破的一道题, 看了讨论区用了 yafu 神器直接得到质因数了, 剩下的用 gmpy2 库一下子就出来了
    • 题目 125 - 【CodeReview】,看着讨论区给出的一个方程, 暴力破解求解出 seed 提交就过了, 至于为啥是这个方程, 各种不懂= =
    • 题目 127 - 【(未过)RPC】,自己的代码敲完了, 但是感觉服务器好像有点问题, 跑代码说是超时了, 讨论区也有人提到这一点, 所以暂时过不了了
    • 题目 128 - 【IP库】,看着讨论区给的代码解决的一道题= =城市 ID 还有 data 文件的分析都是讨论区给的, 甚至连代码都是讨论区抄来的。。。
    • 题目 135 - 【XSS-1】,自己的答案: <img src=1 onerror =alert&#40;'w@tch');, 看着讨论区得到的, 自己研究半天死活出不来
    • 题目 138 - 【NameEncoder】,看了讨论区的算法解决的, 自己没啥好思路。用 Python 写了个测试来测试自己的答案, 包括顺序以及膨胀率的测试。
    • 题目 141 - 【Domain】,用在线网站反查域名, 结果查到一大堆结果, 还是看了讨论区用了 host 命令, 只得到一个, 不过提交上去就对了
    • 题目 144 - 【CSS图灵完备】,就参考着示例代码写一堆 + 和 * 然后就出来了, 分成了 4 种情况来写, 直接把这 4 种情况提交了就过了, 用 WebStorm 开发的
  • 挑战 Python
    • 题目 2 - 【列表排序/字符串逆序/打印字典键】
    • 题目 3 - 【字符串奇数位打印/素数判定/求矩形面积和周长】
    • 题目 4 - 【求解素数/求中位数/小写转换】
    • 题目 5 - 【最大公约数/最小公倍数/大写转换】
    • 题目 6 - 【判断公约数/求公约数个数/打印矩阵】
    • 题目 7 - 【提取数字的每一位/科学计数法表示每一位/2 进制转换】
    • 题目 8 - 【统计单词个数/计算平均值并返回大于平均值的数/计算公式的结果】
    • 题目 9 - 【计算平均值并返回小于平均值且最接近平均值的数/计算公式的结果/矩阵右上半三角元素翻倍】
    • 题目 10 - 【计算平均值以及前移大于平均值的数/首字母大写转换/计算周边元素平均值】
    • 题目 11 - 【计算平均值以及前移大于平均值的数/统计元音字母个数/计算周边元素之和】
    • 题目 12 - 【字符串面值的整数求和/统计大小写字母格式/保留小数位数】
    • 题目 13 - 【产生随机列表/读入矩阵并输出对角线之和/实现矩阵转置】
    • 题目 14 - 【找出矩阵每列最大值/交换变量值/求素数/构造矩阵】
    • 题目 15 - 【进制数转换/找出最长字符串/判断幻方/计算公式】
    • 题目 16 - 【删除空格/回文数判定/二维转一维/数字字符前移】
    • 题目 17 - 【字符串交叉拼接/删除字符串指定字符/矩阵行交换】
    • 题目 18 - 【ASCII 升值排序字符串/字符串奇数位大小写转换/矩阵列左移】
    • 题目 19 - 【按规律生成矩阵/合并整数/矩阵找数】
    • 题目 20 - 【计算公式/统计低于平均分的情况/复制 n 个字符/找素数】