Как спарсить страницу с кодировкой windows-1251 и перекодируя ее в UTF-8?
Как спарсить страницу страницу с кодировкой windows-1251 перекодируя в UTF-8? Суть в том что на той странице в meta заголовке устанавливается кодировка. При попытке перекодировать выдает различные символы, но не кириллицу. На сколько я понял там нужна комбинация перекодировок. Не знаю какую использовать. Вот сайт донор http://www.carsystem.ru
Каждый текстовый редактор по разному перекодирует. А мне нужно чтобы он парсил уже с utf-8 кодировкой, а не получал данные а потом перекодировал, потому что при выкачивании изображений с кириллицей, он не может определить url, так как вместо имя изображения кракозябры. Curl заголовки не дают должного результата, но с помощью одного сервиса удалось перекодировать полученные данные (заголовки полученные библиотекой phpquery и сразу же перекодированные в utf-8 скорее всего CURLOPT_HTTPHEADER). Вот этот сервис https://2cyr.com/decode/?lang=ru
Хоть расстреляй, я не понял вопроса
тебе сохранить страницу надо или динамически её выставить на свой сайт?
- Как изменить Windows-1251 на utf-8 в большом файле У меня есть файл весом 6Mb в формате json, и все русские буквы заменились на кодировку Windows-1251. Как ЗАМЕНИТЬ весь текст в кодировке Windows-1251 на нормальные русские буквы
- Какую кодировку лучше выбрать для сайта windows-1251 или utf-8? Создаю сайт (интернет-магазин) на системе Битрикс. Какую кодировку лучше выбрать для сайта: Windows-1251 или UTF-8?
- Как вернуть прежний вид блок погода на яндекс в гугл хром для Windows 7 на всю страницу а не в углу? 86 версия, пробовал ранние все равно обновляет на 86 браузер
- Windows CMD findstr - поиск кириллических фраз в файлах с utf-8 кодировкой В cmd менял chcp 65001 не помогает, findstr находит только латинские слова.