sab123: (Default)
[personal profile] sab123
С башорга:
<<
aaa: А у меня есть двое знакомых (мужчина и женщина, не родственники, не ровесники, с разными специальностями), которые хранят все свои файлы в одном файле. Типа: "Письма 2010" - фррррр - 110 страниц. "Приказы 2010" - тррррррр - 99 стр. Если нужно распечатать документ, тот копируется и переносится в отдельный файл, печатается, и файл тут же уничтожается. Фиг бы с ними, с этими странными людьми, но мне приходилось работать с их документами. А спросить их, зачем это они так мучаются, я не решалась. Я даже не понимаю, что спрашивать?
bbb: Меня спроси — поиск по ключевым словам делать удобно.
aaa: Ёпть, дак вы еще и размножаетесь!
>>

Впрочем, какой-нибудь Опен Офис - не лучше. А вот гугельные онлайновые документы ищут вовсю.

Вообще непонятно, почему до гуевых программописателей не доходит, что должны быть операции, которые действуют на тучу файлов. Вот скажем попробуйте распечатать сразу сотню вордовых файлов. И я даже когда бываю на всяких выставках, пытаюсь эту мысль до них всех доносить, но пока безуспешно.

P.S. Учет и контроль:
Locations of visitors to this page

Date: 2012-06-29 03:47 pm (UTC)
brmail: (Default)
From: [personal profile] brmail
по поду поиска - куча же движков для этого есть, начиная с индексинга в виндоус эксплорере, который вордовские документы хавает за милую душу, потом desktop search от того же микрософта, от гугла была какая то приблуда, но кажется уже скончалась, плюс сторонние решения, даже русские помнится были - архивариус с каким то номером. Короче кому надо искать , тот найдет чем проиндексировать
по поводу разного распечатать, наверняка тоде есть что то , но за ненадобностью не искал
Edited Date: 2012-06-29 03:49 pm (UTC)

Date: 2012-06-29 04:11 pm (UTC)
From: [identity profile] sab123.livejournal.com
Индексировать - это неправильно. Правильно - это как grep, искать подряд где сказали.

Date: 2012-06-29 04:20 pm (UTC)
brmail: (Default)
From: [personal profile] brmail
ну это смотря как использовать. Если надо поискать раз в несколько дней, то да. А если нужны несколько поисков подряд с разными условиями многократно каждый день, то индексация необходима. Особенно если она достаточно гибкая чтобы происходить тогда когда комп не занят с очень низким приоритетом

Date: 2012-06-30 08:01 am (UTC)
wizzard: (Default)
From: [personal profile] wizzard
> Индексировать - это неправильно

На моей работе у клиента есть сторейдж на 1.5 Пб вордовских и пдф документов. Че-то меня посещают сомнения в эффективности грепа на данном датасете.

edit: а fulltext search отлично работает, с лагом меньше 2-3 секунд от добавления дока.
Edited Date: 2012-06-30 08:02 am (UTC)

Date: 2012-07-03 06:26 pm (UTC)
From: [identity profile] sab123.livejournal.com
Ну, я все же говорю не про центральную базу документов, а про личную кучку.

Date: 2012-07-03 07:28 pm (UTC)
wizzard: (Default)
From: [personal profile] wizzard
На личной кучке пдф-ок (статьи, в основном) фуллтекст тоже очень хорошо себя показывает. Особенно в паре с OCR-движком (увы, старые статьи - сканы, и некоторые новые, имеют отвратительный текстовый слой)

Date: 2012-06-29 05:10 pm (UTC)
wizzard: (Default)
From: [personal profile] wizzard
> попробуйте распечатать сразу сотню вордовых файлов

э... выделил документики, дропнул на принтер. или правой кнопкой - печать. чяднт? :)

Date: 2012-06-29 06:01 pm (UTC)
From: [identity profile] sab123.livejournal.com
О, достижение! Век живи, век учись. Ну тогда другой пример: поменять слово в 100 документах.

Date: 2012-06-30 07:52 am (UTC)
wizzard: (Default)
From: [personal profile] wizzard
У меня на этот вопрос контрпример есть.

Такая задача имеет смысл в контексте программирования, где слова - это относительно уникальные токены, и очень быстро теряет смысл в контексте документов.

Поскольку grep все равно не заменит мне без дополнительных извращений "бетонированные полы", "бетонный пол", на "ламинированные полы, покрытый ламинатом пол" да даже если вдруг там переносы расставлены - "бето-нированные полы", он тоже сольется.

Это уже не говоря о том, что слова естественной речи контекстнозависимы, и я не хотел бы, чтобы у меня вышло так: http://lurkmore.to/Энциклонг

А для документов, внезапно, нужны воркфловы, подписи/визы и диффы. Которые офис (будучи подключенным к шарепоинту) отлично поддерживает. Да даже если положить .doc в SVN, то местный коммит диалог умеет вызывать у ворда diff и merge :)

Date: 2012-06-30 07:56 am (UTC)
wizzard: (Default)
From: [personal profile] wizzard
Меня самого коробит от того, как люди пользуются офисом и подобными приложениями (я пока видел ровно одного человека, кроме себя, который хранит файлы стилей в ворде отдельно от документов, и единицы, которые пользуются аутлайнером, например)

Но это не отменяет того, что есть конторы с нормально построенными и внедренными движками документооборота, которые реально решают все типичные задачи и облегчают людям жизнь.

January 2026

S M T W T F S
     12 3
45 6 7 8 9 10
11 12 13 14 151617
1819202122 23 24
25 26 2728293031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 28th, 2026 03:48 pm
Powered by Dreamwidth Studios