Как скачать свой ЖЖ (и грохнуть его). Сохраняем ЖЖ на свой компьютер с помощью ljArchive Как скачать живой журнал

Суповцы испортили все праздники куче народа. Вся френдлента от них стонет.
Да и вообще из ЕлеЖывого Журнала нормальных пользователей выживают. Статистики теперь не посмотришь, а я через статистику в том числе вылавливала новых френдов. Скоро навяжут новую форму френдленты (она мне категорически не нравится). Народ опять разбегается куды только можно. Полтора года назад я сбежала на дайри. Там мало таких интересных постов, как в ЖЖ, но там не бывает катастрофических улучшений. Форма новой записи там кажется мне удобнее. Там очень удобно организовать опрос (я провела опросы по 600 именам). Там легко настроить дизайн дневника, не зная совершенно никаких программных хитростей (я меняю там дизайн раз в месяц в зависимости от настроения). Там уютно. Там я бессовестно зафлуживаю дневник перепостами из ЖЖ и с Лиру (здесь я это все-таки стесняюсь делать), и мне это прощают.
Одновременно я попробовала сбежать на Лиру, но там нифига не разобралась с настройками и бываю там только наскоками.
Если суповцы таки угробят ЖЖ, лично мне будет очень грустно. Я мало делаю постов в ЖЖ, но долго собирала френдленту. Это именно то, что я хочу читать каждый день. В ней много разного народа, кое-кого я знаю лично, но многих - только по постам жж. И тем не менее, каждый из моих френдов в моих глазах - особенный.

Ну вот это сегодня подвернулось в ленте.
Пусть будет на всякий случай:

Оригинал взят у bigstonedragon в Как скачать чужой ЖЖ

Александр Николаевич Житинский – это уже не первая смерть в моей френд-ленте. Не знаю, будет ли ЖЖ хранить эти журналы как монумент, или рано или поздно сотрет их с лица Земли ЖЖ. Посему давно уже подумывал, что хорошо бы их сохранить себе на комп, дабы было откуда и впредь мудрые и интересные мысли черпать. Но средств подходящих не встречал – много программ, чтобы делать бэкап своего журнала, но не попадалось ни одного, чтобы сохранять журналы чужие.
И вот тут как специально наткнулся на ссылку, которая обеспечивает нужный сервис! Причем программа давняя уже – 2006 год, и очень простенькая – 125 КБ всего. Но дело своё делает!
Заметил три недостатка: во-первых, скачивает только текстовую часть дневника, без картинок; во-вторых, скачивает не весь дневник за один раз, а лишь один год или один какой-нибудь месяц (или несколько месяцев) одного года. И в третьих, делает это достаточно медленно – пашет второй день, скачала всего первые четыре года дневника Житинского (правда, с перерывом на ночь).
Кроме того, если дневник был начат не с начала года (например, Житинский завел его в апреле 2001), то за первые месяцы (январь-апрель в моём случае) в конечный файл попадают записи последнего года (2012 в моём случае).
Однако, несмотря на все эти недостатки, меня выдаваемые результаты всё равно устраивают!
Если кому ещё интересно – вот ссылка для скачивания:

В ЖЖ я пришел ровно 16 лет назад — 15 апреля 2001 года. Некоторые из читателей этого блога, боюсь, еще ходили в детский сад. Не буду закатывать истерик по поводу того, как развивался и во что в результате превратился с тех пор ЖЖ, некролог я ему написал на прошлой неделе. С учетом нового пользовательского соглашения, рисков его использования гораздо больше, чем выгод. Поэтому пришлось его грохнуть, извините, если привыкли меня там читать. Но все претензии — к Rambler, который, я уверен, уже поставил на нем крест. Ничем иным такое отношение и к легендарному сервису и к его пользователям объяснить нельзя.
Уже много лет ЖЖ был просто местом, где оставалась какая-то аудитория, которой там почему-то удобнее, для нее я репостил отсюда и с plushev.com . ОЧень благодарен Антону Меркурову за то что убедил меня сделать standalone.

Разумеется, перед тем, как удалить журнал, я задумался, как бы его скачать, слышал, что многие еще в золотые годы так делали. Поискал разные инструменты, попробовал, но ни черта не получалось. Помог Рома Иванов из Яндекса, за что ему большое спасибо. Кстати, он просил передать, что если вы раньше скачивали ЖЖ описанным ниже способом, проверьте, нормально ли скачались ли у вас посты за 2007 год и раньше. Если нет, придется восстановить ЖЖ (можно сделать в течение года после удаления) и заново скачать.

Все оказалось очень просто. Нужно пойти по этой ссылке и выполнить все довольно простые инструкции на странице. Обратите внимание на команду запуска, она зависит от операционной системы вашего компьютера. Операция потребует времени, особенно, если в ЖЖ вы давно: мой 16-летний ЖЖ размером 2.38 Гб выкачивался 6 часов.

Вот что получилось

Удаляется ЖЖ в несколько кликов, начиная с этой ссылки . В течение года вы сможете его восстановить, если вдруг захотите. Ну и, конечно, какое-то время он останется в кэше поисковиков.

Не надо грустить по ЖЖ, он прожил долгую, по меркам интернета и весьма яркую жизнь. Помянем добрым словом и пойдем дальше. Есть этот блог,

August 2nd, 2011

Current Music: Solar Fields - Ropeburn

Вроде бы и понятно, что ddos-атаки относительно безвредны и все посты в любимом блоге в конечном итоге уцелеют и рано или поздно станут доступны. Но тем не менее хочется чтобы архив был стопроцентно сохранен и был доступен всегда, независимо от помирающего блогосервиса. Поэтому, решено было создать архив моего блога на базе моего же сайта.

Сохранено абсолютно все. За исключением десятка удаленных фотографий (раньше фотохостингом служил мой сайт, а потом я все потер), еще не работают аудио и видео записи, они занимали слишком много места. Для удобства разбито по месяцам. Поиск пока что не работает, впрочем, я не уверен что он там вообще сильно нужен. Как приятный бонус - доступны все скрытые посты, которых, о боги, у меня целых три:) Трафик я постарался минимизировать. Но в среднем, одна страница архива года эдак 2010 весит 5-8 мегабайт. Меньше - нельзя, там же фотки.

А вообще, хочу я вам рассказать, как же все-таки можно сделать архив своего блога в ЖЖ.

Итак, я уже касался этого вопроса во время первой атаки. Теперь хочу вернуться. Так уж вышло что приперло мне сделать полный архив моего блога. Все-таки хочется сохранить все свое словоблудие в удобной для дальнейшего прочтения форме. И так уж вышло, что удобного инструмента в этой деле НЕТ. То есть вообще нет. Есть только несколько костылей разной степени кривизны.

1.1 Способ первый. Offline Explorer.

Скажу сразу, если вашему блогу не менее пяти лет и вы выбрали этот способ - вы либо мазохист, либо вы все-таки мазохист:) Но способ. как не крути - самый привлекательный. на первый взгляд. как видно из названия - прога выкачивает любой сайт полностью или частично и сохраняет его для последующего просмотра в оффлайне. сразу хочу сказать - ЖЖ она сохраняет чуток криво, однако, все ссылки работают и вы фактически не почувствуете разницы. То есть Offline Explorer скачает вам полностью работоспособную копию вашего блога, можно будет походить по ссылкам, заглянуть в архив, перейти по тегам и тд. и тп. но на диске будет твориться чудовищный сука хаос из файлов и папок! Копия моего блога выкачивалась где-то часа два, заняла 500 с лишним мегов и кто знает сколько бы оно еще качалось если бы я не прекратил это непотребство. 500 мегов - это СЛИШКОМ много. Поэтому способ хоть и красив, но никуда не годится.

Если вы все-таки его выбрали - дерзайте. Отключите скачивание с посторонних серверов (только xxxxx.livejournal.com и ничего большего), в фильтре отключайте скачивание архивов, видео, музыки, разрешите скачивать изображения со сторонних сайтов. Плюс глубину скачивания установите на 0 (тобишь выкачивается всё). Еще не забудьте зайти в свой блог через браузер в окне программы и авторизоваться в нем. Иначе подзамочные посты не скачаются. Ну и запаситесь терпением, разумеется.

Где скачать: прога платная, хотя и стоит своих денег. Искать... ну хотя бы и на торрентах.

1.2 Способ второй. Минимализм в абсолюте.

Тут используется прога с названием LJSM . Скажу сразу - командная строка это нихрена не юзер френдли. Почему кто-то до сих пор делает проги, управляемые из командной строки - для меня загадка. Это феерический долбоебизм и отсутствие элементарного уважения к конечному пользователю. Но тем не менее, LJSM - чуть ли не самая толковая в деле скачивания блогов ЖЖ, несмотря на то, что для того чтобы запустить скачивание своего (или чужого) блога вам придется представить себя труЪ-юзером MS DOS из 90х.

Она выкачивает каждый пост в отдельный файл, при желании вместе с картинками, аватарками и комментариями. Плюс - создает файл-оглавление со ссылками на все посты. Довольно удобно, но нельзя допустим сделать набор постов за месяц или за год - прога умеет только распихивать посты по файлам. А еще у скачаных постов слишком аскетичный дизайн - просто черный текст на белом фоне и аватарки. Но с другой стороны - это же архив. Главный плюс тут - объемы. В отличие от Offline Explorer архив у меня получился всего в 40 мегабайт. Третий безусловный плюс - прога сразу же подключается к ЖЖ-шным серверам и начинает качать. Ее почему-то не блокируют в то время как “LJ Archive”(см. далее) тупила два дня, но так и не подрубилась.

О том как ей пользоваться и где ее качать - читайте чуть ниже.

1.3 Способ третий. Золотая середина.

LJ Archive - это нечто среднее между LJSM и Offline Explorer. С одной стороны она специально заточена под ЖЖ и выкачивание исключительно постов. С другой стороны - минимализмом тут и не пахнет, имеется удобный интерфейс, разные сортировки, статистика и все такое прочее.

Неудобства:
1. Посты выкачиваются относительно быстро, сохраняется форматирование текста, картинки подгруживаются из инета, плюс - скачиваются комментарии. Но не выкачиваются аватарки комментирующих. Это что, так трудно было реализовать?! Даже сверхаскетичная LJSM это умеет. Вроде бы - ничего особенного, но с аватаркой, френд “обретает лицо”, он мигом идентифицируется в нагромождении текстов. Вобщем, это тупость, так нельзя делать.
2. Нельзя выкачать картинки вместе с постами. Это еще более тупо. Прога-то для архивирования блога, а архивирует по факту только тексты.
3. Не сохраняется оформление блога. Не критично, но тот дизайн, что предлагает LJ Archive - это пардон, вырвиглазный пиздец. И хорошо хоть цвета можно настроить ручками, а то бы было совсем грустно.

Удобства:
1. Относительно нормальный человеческий экспорт. То есть посты можно читать не только из окна программы, но и из браузера, произведя экспорт в html. Причем можно выбрать как экспортировать - все в один файл (за 5 лет? я даже пробовать не хочу:) или разбить его по месяцам или даже дням.
2. Компактность. Весь архив хранится в одном файле, а так как картинки не скачиваются - объем у этого файла минимальный.
3. Удобство. Удобство поиска, календарь, статистика - все дела.

2.1 Как архив делал я.

1. Скачал и установил LJ Archive. Произвел синхронизацию с блогом - посты скачались.
2. Настроил более-менее приятное глазу оформление.
3. Произвел экспорт в HTML с разбивкой по месяцам - в указаной папке создалось куча файлов. В каждом - посты за определенный месяц.
4. Открыл первый файл в браузере и подождал пока загрузятся все картинки.
5. Сохранил полностью загруженную страницу средствами браузера (Ctrl+S). В результате получилась точно такая же страничка, но со всеми картинками, которые теперь хранятся вместе с ней.
6. Повторил данную операцию для всех остальных файлов архива.
7. Как вариант - можно установить PDF-принтер (например DoPdf) и вместа пятого пункта - отправлять на него каждую страницу. В результате получатся pdf-файлы. Если настроить сжатие картинок хотя бы 144dpi - объем файла на выходе вас приятно удивит. Главный минус тут - если в блоге много фотографий большого размера - скорее всего pdf будет некрасивым и притормаживающим.
8. Доработка напильником. Блог в таком виде весил аж 100 мегабайт. Для домашнего архива - это нормально, для архива, доступного из сети - это никуда не годится. Конвертация в pdf с хорошим сжатием графики - это выход, но для сети это не слишком удобно. Тормозит, зараза:) Поэтому пришлось пошаманить с картинками, благо все они хранились централизовано, в одной папке. Во первых - я уменьшил их все на 50%, во-вторых - я сжал все jpg. Выигрыш получился неплохой - в 2 раза. А теоретически можно и в 3. Но я решил выбрать золотую середину.
9. Полученный набор html-страничек закачал на сайт, сделал страницу-оглавление, прикрутил лайтбокс и собственно всё.

2.2 Как скачать блог с помощью LJSM.

Скачивается все просто. Если вы как и я пользуетесь Total Commander - то все просто. Заходите в папку с программой и набираете в командной строке тотала следующую команду:

Если вы, о боже мой, пользуетесь проводником - придется чуток заморочиться.
1. Нажимаем Windows+R. Или “Пуск->Выполнить”. Но в Висте или Win7 этого пункта нет.
2. Набираем команду cmd
3. Переходим в каталог с LJSM. Но вы ведь никогда не работали в DOS? Ладно, ща объясню. Проще всего будет в самом начале создать на диске С папку LJSM и положить туда файл ljsm.exe. Знач так. Вот в этом черном окне надо вбить всего 2 простые команды.
Вводим команду CD C:\ Нажимаем Enter. Появляется строчка с:\>
Вводим команду CD C:\LJSM Нажимаем Enter Появляется строчка с:\>LJSM>
Отлично, значит вы переместились в папку LJSM.
4. Убеждаемся что интернет работает, а ЖЖ не ддосится.
5. Вбиваем следующую команду:

ljsm -u username:password username

Пример 1: ljsm -u frost123:222222 frost123
Выкачивается все содержимое моего блога (при условии что я - frost123)

Пример 2: ljsm.exe -i3 -d 2011/1:2011/12 -u frost123:22222 frost123
Выкачивается все содержимое моего блога с января по декабрь 2011 года, включая всю графику (-i3) (при условии что я - frost123)

Нажимаем Enter. Если все вбито правильно - по черному окошку поползут строки, а через некоторое время в папке LJSM начнут создаваться папки с выкачанными постами. Когда работа будет завершена - окошко закроется. Или не закроется и напишет отчет.

2.2.1 Почему же я все-таки этого не сделал:

Потому что в LJSM нельзя сгруппировать посты по месяцам. То есть можно, но вручную, в любом текстовом редакторе, а это - огромный объем работ. К тому же, программулина не выкачивает добрую половину картинок. Возможно это мои траблы с инетом, но отследить ошибки не представляется возможным. Ну и напоследок - слишком аскетичный и ненастраиваемый дизайн страниц на выходе. Можно править все ручками, но мне откровенно влом ковыряться в html-коде каждого файла.

Ну вы поняли. Казалось бы - такой старинный и обширный блогосервис, а элементарного инструмента для нормального человеческого экспорта нет и возможно даже не будет. Но, включив фантазию и задействовав кору головного мозга, можно все-таки извернуться и получить более-менее приемлемый результат.

Возможно я немного отстал от жизни, но узнал об этом способе только на днях путем собственных экспериментов. Для чего это нужно? Данный способ позволяет сохранять посты из жж в файл pdf со всеми картинками и ссылками. Но самое главное, он не сохраняет все ненужное оформление дизайна жж. Это работает и с отложенными записями. К примеру, пишите вы пост и вам нужно согласовать его с партерами или заказчиком перед публикацией в жж. Вы сохраняете его в отложенные записи, далее конвертируете в pdf и отсылаете на согласование заказчику. Все очень презентабельно и солидно.
Еще один вариант использования, можно накачать нужное количество постов с описанием мест, сохранить их ридер на планшете или офлайновый Яндекс-диск. В путешествии в любой момент достать и прочесть нужную информацию либо посмотреть фотографии.


Начнем. Сразу оговорюсь, что у меня Mac. Буду показывать как это делается в браузере Safari, но насколько знаю в хроме под виндой такое тоже возможно. Главное уловите суть, а там уже сами пробуйте.

Для наглядности я взял свой с всемирной выставки в Милане Expo 2015 о российском павильоне. В нем есть и текст и 38 достаточно больших фотографий. Будем его сохранять в файл pdf.

1. Итак, вот как он выглядит у меня в жж. В браузере safari есть чудо-кнопка которая переводит пост в режим просмотра. Кнопка указана стрелкой. Нажимаем её:

2. После нажатия на эту кнопку остается в просмотре только пост, без лишнего блогерского дизайна:

3. Следующим шагом идем ФАЙЛ-ПЕЧАТЬ. Открывается меню печати. По умолчанию у вас будут стоять настройки принтера. Скорее всего формат бумаги А4. Тут нужно понимать, что если вы оставите формат А4, то весь длинный пост разобъется на множесво листов А4-го формата. Причем разобъется коряво. К примеру, в конце листа если не будет вмещаться фотография, то он оставит описание чуть ниже середины листа, а фото перенесет на следующий лист. Очень некрасиво. Я предлагаю сделать вот что. Заходим в формат бумаги и выставляем ручные параметры листа. Ширину оставляем 297мм.(А4), а вот высоту ставим такую, чтобы весь пост уместился на одном листе. Смотрите левый выделенный столбик. Для моего поста на 38 фото понадобилась высота 10,000 мм. Формат pdf отлично масштабируется и никакого труда не составит его раскрыть по ширине и спокойно скролить вниз.
ВАЖНО: обязательно уберите галочки с "Напечатать фон" и "Напечатать колонтитулы"
Итак, мы выставили параметры печати, но печать нам не требуется. Нам нужно сохранить файл. Жмем на синюю стрелку в левом нижнем углу(как на скрине):

4. После нажатия на стрелку выпадет меню, где нужно выбрать "Сохранить как PDF". Все. Выбираете папку сохранения. Можете сразу закинуть на яндекс-диск и потом на планшете перевести эту папку в офлайн режим. У вас появится доступ ко всем фалам в этой папке без доступа в интернет. Но имейте в виду, что память планшета уменьшится ровно на размер этой папки:

5. В pdf сейчас этот пост открывается вот так. Очень удобно. Это отдельный файл который весит 17 мегабайт:

Если вы хотите открыть его на вашем компьютере и посмотреть как он сохранился, то вот ссылка для скачивания файла PDF с этим постом об Экспо.

Сравните качество фото и удобство прочтения.

На этом все.

p.s. кстати, этот способ может пригодиться не только для сохранения постов жж, но и других материалов в интернете.

p.s.s для винды, а именно для Google Chrome . Тут рассказывается как установить плагин в хром который активирует режим чтения и из него же можно отправить на печать(в режиме печати изменяем принтер на "сохранить в pdf)