Нужно выбрать источники для ваших скачиваний, желательно где нет "защиты от роботов" (captcha)
Именно скачать можно будет пробегая программой страницу(автоматическое оформление думаю уже лишнее: если скачано бесплатно, то скрипт не сможет выбрать цену). Например, раз в час ваш сайт пролистывает выбранный источник книг, сверяет имеющиеся там с вашей базой, новые скачивает
Ссылки и названия можно искать через [Ссылки могут видеть только зарегистрированные пользователи. ] или простой поиск в строке