头歌python实训通关九

您所在的位置：网站首页 › 计算思维是计算机的思维是否正确 › 头歌python实训通关九

头歌python实训通关九

2024-07-11 11:20| 来源: 网络整理| 查看: 265

第1关：zip压缩文件暴力破解

任务描述

本关任务：编写一个能暴力破解加密Zip文件的小程序。

相关知识

曾经有一次案件，当时黑客组织发布了ANONOPS_The_Press_Release这份稿件，希腊警方在稿件的元信息中发现了作者Alex Tapanaris的名字，然后以此为证据将其逮捕，也就是所谓的电子取证。基本思路是，调用Python中的PyPDF2模块的getDocumentInfo函数，提取PDF文件中的元数据。

PyPDF2

PyPDF2是作为PDF工具包构建的python库，它能够:

提取文档信息（标题，作者，...）按页拆分文档逐页合并文档裁剪页面合并多个页面到一个页对pdf文档进行加密解密等等

注意，这个模块的名字对大小写是敏感的，所以，确保y是小写的，其他字母都是大写的 #####PdfFileReader 构造方法： PyPDF2.PdfFileReader(stream,strict = True,warndest = None,overwriteWarnings = True) 初始化一个 PdfFileReader 对象，此操作可能需要一些时间，因为 PDF 流的交叉引用表被读入内存。

PdfFileReader 对象的属性和方法

PdfFileWriter

这个类支持 PDF 文件，给出其他类生成的页面。

属性和方法 |描述 -|-|- addAttachment(fname,fdata) |在 PDF 中嵌入文件 addBlankPage(width= None,height=None) |追加一个空白页面到这个 PDF 文件并返回它 addBookmark(title,pagenum,parent=None,color=None,bold=False,italic=False,fit='/fit,*args') addJS(javascript) |添加将在打开此 PDF 是启动的 javascript addLink(pagenum,pagedest,rect,border=None,fit='/fit',*args) |从一个矩形区域添加一个内部链接到指定的页面 addPage(page) |添加一个页面到这个PDF 文件，该页面通常从 PdfFileReader 实例获取 getNumpages() |页数 getPage(pageNumber) |从这个 PDF 文件中检索一个编号的页面 insertBlankPage(width=None,height=None,index=0) |插入一个空白页面到这个PDF文件并返回它，如果没有指定页面大小，就使用最后一页的大小 insertPage(page,index=0) |在这个 PDF 文件中插入一个页面，该页面通常从 PdfFileReader 实例获取 removeLinks() |从次数出中删除连接盒注释 removeText(ignoreByteStringObject = False) |从这个输出中删除图像 write(stream) |将添加到此对象的页面集合写入 PDF 文件

例子

分割文档（取第五页之后的页面），取第五页之后的页面，将test.pdf第五页之后的页面分割保存到copy.pdf。 import PyPDF2 from PyPDF2 import PdfFileReader from PyPDF2 import PdfFileWriter

def splitPdf():readFile = 'test.pdf'outFile = 'copy.pdf'pdfFileWriter = PdfFileWriter()# 获取 PdfFileReader 对象pdfFileReader = PdfFileReader(open(readFile, 'rb'))# 文档总页数numPages = pdfFileReader.getNumPages()#如果pdf页数大于5，再分割if numPages > 5:# 从第五页之后的页面，输出到一个新的文件中，即分割文档for index in range(5, numPages):pageObj = pdfFileReader.getPage(index)pdfFileWriter.addPage(pageObj)# 添加完每页，再一起保存至文件中pdfFileWriter.write(open(outFile, 'wb'))splitPdf()

编程要求

现有一份来自黑客组织的PDF新闻稿step2/1.pdf。请你对1.pdf稿件解析元信息，得出黑客信息，给警方提供线索。在右侧编辑器中有一个Evidence函数，它有一个参数path，代表这个PDF的路径，或者是另一个类似的PDF文件的路径，它们的区别仅在于元数据上。请你在这个函数中读取指定新闻稿的元数据，并将其按照 : 的格式打印出来。注意：从PDF中读取的属性名会包含一些非字母符号，请在显示之前去掉这些符号。如果不知道有哪些符号，可以先输出一下原始的内容观察一下。测试数据由评测系统读取并传递给Evidence函数，期间产生的输出将会与规定的输出进行比较，详细要求请见测试说明。

测试说明

应该得到的是： Author : miao chunyu Creator : Microsoft® Word 2013 CreationDate : D:20200202141604+08'00' ModDate : D:20200202141604+08'00' Producer : Microsoft® Word 2013 即测试集1的预期输出。

# coding:utf-8 import PyPDF2 from PyPDF2 import PdfFileReader def Evidence(path): #读取并打印PDF的元信息 # 请在此添加实现代码 # # ********** Begin *********# with open (path,'rb') as file: pdf_reader = PyPDF2.PdfFileReader(file) metadata = pdf_reader.getDocumentInfo() for key,value in metadata.items(): print(key.replace("/",""),":" ,value) # ********** End **********#

第3关：图像取证

任务描述

本关任务：编写一个能读取图像Exif头的小程序。

头歌python实训通关九

头歌python实训通关九

今日新闻

推荐新闻