Input

Installing necessary packages

!pip install pdfminer.six

!pip install gTTS

Import library

from io import StringIO
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from pdfminer.pdfdocument import PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.pdfpage import PDFPage
from pdfminer.pdfparser import PDFParser
from gtts import gTTS

Model

Function to convert pdf file to text

def convert_pdf_to_string(file_path):

    output_string = StringIO()
    with open(file_path, "rb") as in_file:
        parser = PDFParser(in_file)
        doc = PDFDocument(parser)
        rsrcmgr = PDFResourceManager()
        device = TextConverter(rsrcmgr, output_string, laparams=LAParams())
        interpreter = PDFPageInterpreter(rsrcmgr, device)
        for page in PDFPage.create_pages(doc):
            interpreter.process_page(page)

    return output_string.getvalue()


def convert_title_to_filename(title):
    filename = title.lower()
    filename = filename.replace(" ", "_")
    return filename


def split_to_title_and_pagenum(table_of_contents_entry):
    title_and_pagenum = table_of_contents_entry.strip()

    title = None
    pagenum = None

    if len(title_and_pagenum) > 0:
        if title_and_pagenum[-1].isdigit():
            i = -2
            while title_and_pagenum[i].isdigit():
                i -= 1

            title = title_and_pagenum[:i].strip()
            pagenum = int(title_and_pagenum[i:].strip())

    return title, pagenum

Output

Content

pdf_name = "Installation_Guide.pdf"  # .pdf file you want to convert
print(convert_pdf_to_string(pdf_name))

Converting to mp3

rr = convert_pdf_to_string(pdf_name)
string_of_text = ""
for text in rr:
    string_of_text += text

final_file = gTTS(text=string_of_text, lang="en")  # store file in variable
final_file.save("Generated Speech.mp3")  # save file to computer

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

PDF_Transform_to_MP3.md

PDF_Transform_to_MP3.md

Input

Installing necessary packages

Import library

Model

Function to convert pdf file to text

Output

Content

Converting to mp3

Files

PDF_Transform_to_MP3.md

Latest commit

History

PDF_Transform_to_MP3.md

File metadata and controls

Input

Installing necessary packages

Import library

Model

Function to convert pdf file to text

Output

Content

Converting to mp3