Сохранение переведенных PDF-файлов Azure в виде файлов MS Word docx

avatar
Otuoma Sanya
8 августа 2021 в 17:53
64
0
0

Я перевожу несколько файлов PDF с помощью перевода документов Azure. Я использую python с инфраструктурой Django, и перевод работает, как и ожидалось. У меня есть исходный контейнер, в который я загружаю большие двоичные объекты, а затем еще один целевой контейнер, в котором сохраняются переведенные файлы.

Моя проблема в том, что мне нужно внести некоторые изменения в переведенные файлы, но переводчик документов сохраняет файлы в формате PDF. Я знаю, что могу использовать другие инструменты для дальнейшего преобразования PDF-файлов в MS Word, но можно ли преобразовать PDF-файл в MS Word в Azure Translation AI? Я все еще просматриваю документацию, но буду признателен за быструю ссылку на то, что я ищу, если она существует.

Часть моего кода показана ниже

def get(self, request, *args, **kwargs):

        subscription_key = settings.AZURE_SUBSCRIPTION_KEY
        endpoint = settings.AZURE_DOCUMENT_TRANSLATION_ENDPOINT
        sourceUrl = settings.AZURE_SOURCE_SAS_URL
        targetUrl = settings.AZURE_TARGET_SAS_URL

        client = DocumentTranslationClient(endpoint, AzureKeyCredential(subscription_key))

        poller = client.begin_translation(sourceUrl, targetUrl, "ar")

        result = poller.result()

        return {
            'status': poller.status(),
            'created': poller.details.created_on,
            'last_updated': poller.details.last_updated_on,
            'total_documents': poller.details.documents_total_count,
            'total_failed': poller.details.documents_failed_count,
            'total_succeeded': poller.details.documents_succeeded_count,
        }

Источник

Ответы (0)