Python-скрипт для автоматического извлечения и скачивания изображений из архива сообщений ВКонтакте.
Перед использованием необходимо получить архив ВКонтакте. Как это сделать?
- Поиск изображений в HTML-фалйах чата ВКонтакте по ссылкам вида
https://sun9-*.userapi.com/... - Извлечение даты отправки сообщения и запись её в EXIF-метку DateTimeOriginal изображения
- Сохранение фотографий из чата под нумерованными именами
- Многопоточная загрузка (по умолчанию установлено 4 потока)
- Ведение журнала ошибок:
errors.log
- Установите Python 3.7+
- Установите зависимости:
pip install -r requirements.txt
- Получите архив ВКонтакте
- Разархивируйте полученный архив
- В полученной папке Archive откройте файл index.html
- Откройте диалог, из которого вы хотите экспортировать все изображения в веб-интерфейсе
- Укажите директорию диалога из строки браузера после аргумента -s, например C:\Archive\messages\31337
- Укажите директорию, в которую вы хотите сохранить фотографии после аргумента -d, директория должна существовать
Пример:
python vk_image_exporter.py -s "C:\Archive\messages\31337" -d "C:\Users\User\Pictures\vk_photos"
- Скрипт обрабатывает файлы
messages*.htmlв указанной директории. - Из каждого блока
.message__header, файлаmessages*.html, в котором найдена ссылка видаhttps://sun9-*.userapi.com/...извлекается дата формата11 мая 2022 в 16:26:36. - Дата конвертируется в формат
YYYY:MM:DD HH:MM:SSдля EXIF.