Карманный гайд для веб-автоматизаторов Browser Automation Studio
Шрифт:
UNIX-время – способ кодирования времени, принятый в операционных системах.
Время UNIX согласуется с UTC.
Способ хранения времени в виде количества секунд очень удобно использовать при сравнении дат (с точностью до секунды), а также для хранения дат: при необходимости их можно преобразовать в любой удобно-читаемый формат.
Дата и время в этом формате также занимают очень мало места (4 или 8 байтов, в зависимости от размера машинного слова), поэтому его разумно использовать для хранения больших объёмов дат. В большинстве случаев эффективнее хранить время в виде одной величины, а не набора полей.
Модуль "Дата и Время" богат своими действиям: строку в дату и обратно, миллисекунды в дату и обратно, создать дату, изменить дату, добавить секунды к дате, разница между датами, дата сейчас, изменить и получить часовой пояс, день месяца, недели, года, получить год, месяц, часы, минуты, секунды и миллисекунды из даты.
Если вы планируете вызывать скрипт по определенному времени, то этот модуль вам идеально подойдет. Либо вы можете воспользоваться встроенным планировщиком задач.
Модуль создан для упрощения работы с файлами на вашем компьютере.
Сюда включены важные действия такие как: читать файл, запись в файл, информация о файле/папке, создать и удалить папку, переместить, копировать файл/папку, поиск файлов, читать или записывать файл в список.
Если ваша задача работать с текстовыми видами файлов или картинками или папка, то вы часто будете использовать данный модуль.
Модуль создан для подмены параметров и свойств браузера, в котором вы производите автоматические операции.
Отпечаток браузера – это набор свойств и характеристик вашего компьютера или ноутбука, которые определяются посещаемым вами сайтом (это видеокарта, разрешение экрана, шрифты, расширения в браузере, батарея ноутбука и тд. тп)
Подменять устройство или отпечаток браузера необходимо всегда, когда вы работаете с любыми сайтами, поскольку они анализируют и выявляют одинаковые устройства.
Подмена устройства необязательна если вы работаете в 1 поток.
Но если вы не будете подменять устройство при многопоточной работе, то сайт вас вычислит и наложит какие-либо ограничения.
Отпечатки браузера по-умолчанию бесплатные для подмены устройств Chrome.
Если вам понадобятся расширенные настройка и другие устройства такие как Iphone, Android, Firefox, то необходимо оплатить подписку к базе отпечатков на 1 или 3 месяца. Это недорого!
Модуль "Список" используется для работы с массивами (списками).
Список или массив – это упорядоченный конечный набор элементов. Например, список задач, имён, фамилий, емейлов, аккаунтов, телефонов.
Часто вам придется работать с большим количеством аккаунтов для какого-либо сайта и тут как раз пригодятся списки.
Например, вам необходимо из списка использовать только 1 конкретный аккаунт, а не все.
Данный модуль позволяет работать с динамическими путями и получать информацию из них.
Динамический путь – это путь к файлу или папке, которыи изменяется в зависимости от его местоположения.
Например, вы работаете с профилями и вам необходимо помещать их в корневую папку со скриптом в процессе его работы. Или, например, вам необходимо из полученного пути определить расширение файла.
Модуль предназначен для создания и переключения между профилями браузера.
По-умолчанию, BAS использует движок браузера Chromium и такие же профили как в обычном браузере Chrome.
Профили – это папки, в которых хранится ваша информация о посещенных сайтах, расширениях, cookies, сохраненный кэш со страниц сайтов и другая важная информация.
Профили помогают сохранить авторизацию на сайтах и повторно на них не авторизовываться.
Модуль "Ресурсы" позволяет осуществлять работу с ресурсами скриптов в BAS.
Ресурсы – это входные глобальные параметры скрипта, которые могут динамически меняться при работе.
Ресурсы используется как настройки при старте сценария автоматизации.
Например, это может быть кол-во потоков, txt файл с аккаунтами, почтами, случайно сгенерированные данные и тд тп.
Один из самых больших модулей в линейке. Позволяет производить любые операции со строками, в том числе подравнивать и очищать лишние символы и даже извлекать почты, телефоны и ссылки из них.
Чаще всего в модуле вы будете использовать "Случайная строка", "Шаблон", "Получить длину", "Заменить строку" и "Парсить CSV строку".
Например с помощью "Случайная строка" можно сгенерировать случайный пароль для регистрации нового аккаунта.
Модуль позволяет работать с ХРАТН.
ХРАТН – язык запросов к HTML/XML страницам.
Один из часто используемых модулей в BAS, с помощью которого можно очень быстро извлекать элементы и тексты со страниц.
Например, вы делаете парсер Avito с использованием браузера и вам необходимо с карточки товара получить хар-ки, описание и фото.
В этом вам поможет ХРАТН.
Модуль служит для работы с общепринятым форматом данных JavaScript Object Notation (JSON).