История автоспорта
Форум истории автоспорта => Исследовательская лаборатория => Тема начата: Александр Кречетов от Сентября 25, 2008, 21:11:05
-
Уже несколько раз мелькал здесь этот ресурс:
http://books.google.com/books?hl=ru
На нём можно найти достаточно много интересных книг по автоспорту, пользуясь поиском, который, кажется, и в содержании самих книг находит ключевые слова, то есть тект возможно распознан. Не все книги достуны для просмотора, а просмотр чаще всего ограничен: некоторые страницы скрыты. Кроме того, довольно неудобно читать, листать. Для людей со слабым интернетом наверное ещё проблемнее.
Но есть отличный сайт:
http://book.huhiho.com/
Нужно вставить ссылку на книгу из http://books.google.com (на сайте book.huhiho.com разобран пример). Происходит процесс, аналогичный скачиванию роликов с ютуба через похожие сайты-помощники. В итоге выдается список выявленных страниц книги в виде картинок максимально возможного, судя по просмотру на самом сайте, размера (сами полученные ссылки страниц книги ведут на books.google.com). Страницы книги далее сохраняются как обычно
Важно отметить, что сайт-помощник может показать ссылки на страницы книги не с первой попытки.
На сайте-помощнике рекомендуется пользоваться "Флеш-гетом", для выявления ссылок со старинцы для последующего массового сохранения.Александр Кречетов39717,8348611111
-
Мда, похоже на эту качалку также распространяется ограничение по количеству страниц для просмотра, которое действует непосредственно на Google Books. На разных компах оно дает скачать только по 28 страниц. Поэтому предлагаю кооперацию. Кто-то начинает качать книгу, указывает, выкладывает скачанное и на каком файле произошла остановка, следующий продолжает качать и т.д. На книгу из 400 страниц надобно 15 человек (ну, или меньше, если есть доступ Интернета и дома, и на работе).
Например:
Mercedes And Auto Racing In The Belle Epoque, 1895-1915 (http://books.google.com/books?id=1dxZK6iHPXQC)http://books.google.com/books?id=1dxZK6iHPXQC
качание продолжать с РА38.jpg
Выкачанное вывалю вечером
******************
Количество интересных книг просто невероятно...
Alexey Grushko (Unicorn)39717,7052083333
-
А прямые ссылки на картинки есть? Ссылки с извращениями я скачивать, скорее всего, не смогу.
Или поставлю вопрос так: можно ли составить список ссылок?
-
Насколько я понял, этот ресурс и формирует список прямых ссылок. Я вечером уже из дому поэкспериментирую и выложу тебе на пробу список.
-
http://disk.tom.ru/2q7wq
-
Ну так что, это только у меня проблема в 24-28 ссылок? Пробовали скачивать по списку?
И вообще, есть ли еще желающие - у меня физически не получается самостоятельно полностью выкачивать книгу.
Можем делать так - я делаю общий список ссылок, разбиваю его на группы по 20 штук, забираю качать первые две, а остальные отписываются, какой номер группы был взят, чтобы не было дубляжа.
-
http://disk.tom.ru/2q7wq
Это список ссылок на страницы без фотографий начиная с 38-й?
-
Да, это без тех первых страниц, которые были уже скачаны.
А что значит "страницы без фотографий"?
-
Начинаю качать с 38 по 58 страницы.
-
А что значит "страницы без фотографий"?
Потому что на месте фотографий я вижу только надпись Copyrighted image.
Как всегда делаю что-то не то?
Александр Кульчицкий39718,7710069444
-
Да нет, похоже для этой книги специально вырезали фотографии. У других книг я такого не встречал.
-
А что значит "страницы без фотографий"?
Потому что на месте фотографий я вижу только надпись Copyrighted image.
Как всегда делаю что-то не то?
Нет, в данном случае то, но подозреваю, что ты сделал неправильно, что начал просматривать страницы, никого не предупредив, какие. В результате я сейчас скачал несколько страниц, мой лимит был исчерпан, но я подозреваю, что ты скачивал те же самые страницы с начала списка, мы сделали двойную работу и исправить ситуацию не сможем из-за пресловутого лимита.
Я скачал страницы с 38 по 47 и с 55 по 58: 038-047,055-058.rar (http://disk.tom.ru/ejthrj1/1/32e23/038-047%2C055-058.rar) (http://disk.tom.ru/ejthrj1).
-
Продолжаем с книгой по Мерседесу
Обложка, вступление, страницы с 1 по 37, 48-54 и 59-й
http://disk.tom.ru/fw6hp
****************************
Остаток книги -http://disk.tom.ru/kkeuz
внутри док-файл с 12-ю страницами, на каждой странице - 20 ссылок. Объявляйте номер страницы, с которой качаете.
****************************
Я думаю, что пока мы не закончим с этой книгой, другими заниматься смысла нет. Хотя я начал еще одну, и у меня получилось по ней вчера скачать страниц 25, а сегодня еще 15. Попробую завтра, может ограничение стоит суточное...
-
Лёша, командуй парадом, будем следовать твоим инструкциям.
-
А что значит "страницы без фотографий"?
Потому что на месте фотографий я вижу только надпись Copyrighted image.
Как всегда делаю что-то не то?
Нет, в данном случае то, но подозреваю, что ты сделал неправильно, что начал просматривать страницы, никого не предупредив, какие. В результате я сейчас скачал несколько страниц, мой лимит был исчерпан, но я подозреваю, что ты скачивал те же самые страницы с начала списка, мы сделали двойную работу и исправить ситуацию не сможем из-за пресловутого лимита.
Я скачал страницы с 38 по 47 и с 55 по 58: 038-047,055-058.rar (http://disk.tom.ru/ejthrj1/1/32e23/038-047%2C055-058.rar) (http://disk.tom.ru/ejthrj1).
Алексей, я ничего не скачивал, если я правильно понимаю суть вопроса, я просто открыл на "Кибердиске" список ссылок, который ты выложил, и сохранил из этого списка несколько страниц на пробу.
Если я сделал то, что надо, то что делать дальше? Если нет, то что надо было делать?
-
Есть хорошая новость - ограничение по количеству ссылок, похоже, действует исключительно на протяжении суток. Поэтому каждый учасник раз в сутки сможет выкачивать часть книги.
***************************
Вот выкачанные страницы с 12-й страницы-части (последней) книги по Мерседесу. Осталось 11 частей (1-11)
http://disk.tom.ru/xkvh6
***************************
Инструкции очень простые.
Я указываю книгу, которую мы в данный момент сохраняем и выкладываю ссылки на страницы, разбитые по частям. Ссылки содержатся в док-файле, 1 страница = 1 часть. Человек, помогающий сохранять книгу, отписывает: "Беру энную часть" и качает ее. Естественно, остальным ее (часть) качать смысла нет. После выкачки выкладываются сохраненные страницы. И так далее.
-
Мне удалось сохранить пока только 4 первые ссылки с 11-й страницы.
****************
Господа форумчане! А никому больше книги не интересны? Трудов-то немного - взять 20 ссылок и по ним скачать (через FlashGet или DownloadMaster) около 2-х мегабайт? Или у всех остальных сразу книга целиком выкачивается?
-
Качаю первую страницу из списка (страницы книги 60-79).
-
Скажем так: я попытался покачать, но не смог. У меня, видимо, ограничение всё ещё действует.
-
Лёша, какие успехи с этим проектом?
-
Периодически удается выкачивать по 5-10 страниц с этой книги и еще с одной, но все равно в одиночку тяжеловато. Я к выходным выложу скачанное и обновленные списки ссылок.
-
Давай, да я попробую снова.
-
Я бы подключился, но нужен список того, что надо "тупо" скачать.
Кстати, есть серьёзный дефект при скачивании через http://book.huhiho.com/ Скачиваются страницы с английской версии ресурса books.google. А они по умолчанию по ширине 800 пикселей и в английской нет возможности увеличения страниц. Есть вариант сохранять страницы книг из временных файлов, если использовать при просмотре "Интернет Эксплорер". Надо в полноэкранном режиме с максимальным приближением (эти функции на том ресурсе) пролистать книгу на сколько можно вдаль. Просмотренные страницы книги содержаться в папке
C:\Documents and Settings\[Имя]\Local Settings\Temporary Internet Files
Оттуда файлы с расширениями .bmp и .png надо копировать по одному в папку, где потом будут храниться на жестком диске. Их легко переименовать в нужну страницу после копирования, так как адрес страницы в Интернете отмечается в папке временных файлов, а в адресе можно увидеть номер страницы. И если приблизить на максимум, то сохраняются страницы с шириной 1000 пикселей. Не все страницы бывают сразу доступными, но некоторые становятся доступными через пару часов, а некоторые могут быть недоступны всегда.
-
Лёша, чем всё закончилось?
-
http://book.huhiho.com закрыли, безуспешно ищу другие способы.
-
Так, лавочка вновь открылась
http://book.huhiho.com/howto
Тут лежат подробные инструкции, что и как делать.
Сначала по ссылкам качаем Firefox, ставим его, потом ставим к нему аддон Greasemonkey
После этого по другой ссылке ставим Userscript - Google book downloader
И все. Теперь по конкретной книге справа при просмотре страниц мы нажимаем Download book, выбираем, с какой страницы нам надо, формируем список ссылок, правая кнопка мыши - закачать.
Но есть все же один недостаток - Google после нескольких скачанных страниц определяет, что что-то тут не чисто, и не дает качать все страницы. Поэтому возобновим коллективные усилия. Есть три книги, которые я не полностью выкачал (закончим эти - перейдем к следующим). Внизу вы найдете их названия, ссылки на них и страницы, которые выкачать не удалось. Поэтому когда будете ставить на закачку страницы - выбирайте только отсутствующие. Чтобы не было дубляжа, оставляйте сообщение, что будете качать, тогда пусть остальные ждут ваших результатов и смотрят, что еще надо докачать.
Alexey Grushko (Unicorn)39865,04125
-
Autodrome: The Lost Race Circuits of Europe http://books.google.com/books?id=mN9YPDrMiAUC&printsec=frontcover&dq=Lost+circuits &lr=&as_brr=3&hl=ru
http://disk.tom.ru/18ljc
*******
Mercedes and Auto Racing in the Belle Epoque, 1895-1915: 1895 - 1915 http://books.google.com/books?id=1dxZK6iHPXQC&printsec=frontcover&dq=Mercedes+Bell e&lr=&as_brr=3&hl=ru
http://disk.tom.ru/b4ck8
********
Dino: The Little Ferrari http://books.google.com/books?id=mHtmx8YIam0C&printsec=frontcover&dq=Doug+Nye+Dino &hl=ru
http://disk.tom.ru/24kcj
-
The 500cc Racing Car http://books.google.com/books?id=WH72wqX08x4C&pg=PA5&dq=motor+racing&lr=&a s_brr=3&hl=ru#PPA1,M1
Получилось сохранить 3-7 и 10-11 страницы + обложка. Всего же в книге 32 страницы
-
Кто-то может проверить, лежит ли по этой ссылке https://play.google.com/store/books/details/Fastest_of_the_First?id=Jv7lPAAACAAJ (https://play.google.com/store/books/details/Fastest_of_the_First?id=Jv7lPAAACAAJ) книга? Через срытый режим Оперы (страна всё равно определяется) и через сервис Anonymouse (за такое они хотят денег) не получается.
-
Хочу подытожить способы скачивания книг с сервиса "Гугл-букс", которые существуют на сегодняшний день.
Для начала напомню, что существуют четыре вида книг, выложенных в "Гугл-букс":
1) Бесплатные эл. книги - эти книги можно скачивать напрямую через сервис "Гугл-букс" в формате ПДФ целиком (после открытия такой книги слева будет "шестерёнка", в которой содержится данная операция);
2) Без предварительного просмотра - эти книги невозможно просмотреть или скачать с "Гугл-букс" (присутствует только обложка и описание книги);
3) Предварительный просмотр - эти книги можно просмотреть на "Гугл-букс" на 70-80%, однако в зависимости от вашего местонахождения (вашего "Ай-Пи") открывается только определённое количество страниц;
4) Полный просмотр - эти книги можно просмотреть на "Гугл-букс" на 100%, однако в зависимости от вашего местонахождения (вашего "Ай-Пи") открывается только определённое количество страниц.
Именно для третьей группы я изложу инструкцию по скачиванию ниже.
Шаг 1. Скачиваем браузер "Мозилла" (https://www.mozilla.org/ru/firefox/) и устанавливаем его на ПК.
Шаг 2. Открываем "Мозиллу", выбираем иконку "Настройки" (справа - "три горизонтальные линии"), в выпавшем меню выбираем "Дополнения". Далее справа выбираем пункт "Расширения", после этого слева видим окошко для поиска ("поиск среди дополнений"), куда необходимо ввести "greasemonkey" и нажать клавишу "Ввод".
Шаг 3. В появившихся дополнениях выбираем "Greasemonkey" (которое только с обезьянкой) и нажимаем кнопку справа "Установить". Перезапускаем "Мозиллу" (т.е. полностью закрываем, а затем открываем).
Шаг 4. Во вкладке переходим на сайт https://greasyfork.org/ (https://greasyfork.org/ru/) и в окошке для поиска набираем "gbookdown". После этого появится ссылка GBookDown - Download Google Books (https://greasyfork.org/ru/scripts/17113-gbookdown-download-google-books), по которой нужно перейти. В появившейся странице нажмите зелёную кнопку "Установить этот скрипт" и в новом окошке нажмите "Установить". Позже "Мозилла" сообщит об успешной установке скрипта (подтвеждаем кнопкой "Ок").
Шаг 5. Открываем интересующую вас книгу на "Гугл-букс" с предварительным или полным просмотром. Когда в браузере станут появляться первые страницы книги внизу сразу появится новое жёлтое окошко. В поле "I already have" необходимо указать количество ПЕРВЫХ страниц, которые уже скачаны: если книга ещё не скачивалась, то оставьте это поле пустым. Нажмите на кнопку "Start". После слов "There are max --- page available" появится МАКСИМАЛЬНОЕ число страниц, которое можно скачать в этой книге. После окончания процесса браузер предложит сохранить страницы ПНГ в "рар"-архиве.
Для четвёртой группы необходимо скачать не "Мозиллу", а портативную версию "Тор" без установки (https://sourceforge.net/projects/torbrowserportable/). Далее повторить все шаги вышеуказанной инструкции применительно к "Тору", предварительно обязательно отключите в настройках "Тора" автоматическое обновление"! После шага 5 нужно нажать на "луковицу" слева от адресной строки и сменить "Ай-Пи", "Тор" перезапустится и для продолжения скачивания нужно будет указать количество страниц в поле "I already have", которое уже закачано и нажать на кнопку "Start". Скрипт продолжит работу. Менять "Ай-Пи" необходимо до тех пор, пока не дойдёте до последней страницы.
Однако скачать за один день все страницы вряд ли удастся, т.к. "Гугл-букс" специально ограничивает просмотр по регионам, т.е. будут пропуски страниц. Поэтому приходится закачивать страницы ежедневно (раз в день). В среднем на книгу уходит 1-2 недели, но бывают исключения как приятные, так и не очень.
Дополнительно выкладываю видеоинструкцию на английском языке (https://drive.google.com/file/d/0B_x__uIHJMFxdEc0X1piMlpzZUE/view), с помощью которой я всё пошагово описал для всех желающих.
P.S.: Существуют программы для скачивания книг с "Гугл-букс", например, "Google Books Downloader". Однако они не могут обойти региональное ограничение и скачивают около 25% от возможного количества страниц.