Свежие комментарии

Title Comment
Спасибо!

Спасибо!

Несколько лет назад знал один метод -- выложить в сеть и...

Несколько лет назад знал один метод -- выложить в сеть и... скормить гуглу. :-)
А по итогам прочитать закешированное как текст.

Жанр можно получить методами Байеса: все встреченные в тексте словосочетания (с учетом и без анализа падежей) сортируются и получают рейтинг встречаемости.
Далее, требуются "комплекты" рейтингов для эталонных текстов, с ними будут сравниваться заголовки, цитаты, прямая речь и повествование каждой страницы документа.

Результат - набор данных, таких как:

  • интервалы (в строках) между заголовками и прочими атрибутами текста,
  • встречаемость словосочетаний внутри каждого из атрибутов

При этом, необходимо обращать внимание на содержимое пары верхних строк и пары нижних. В них могут быть название, автор, издание.

Полностью разобранный текст необходимо повторно превратить в текст без атрибутов, такой, как после lynx -dump, плоский, с неразобранным по столбцам текстом.

По межсимвольным интервалам (средней длине подстрок), определяем столбцы текста, восстанавливаем его в неразорванные строки. Логичным способом удаляем пробелы между символами (бывает такое, что после каждой буквы по одному).

В результате будем иметь чистый текст для индексирования/реконструкции документа и атрибуты и вектор рейтингов (не вероятностей!) для каждой страницы текста. Далее эти вектора обращаем в график, по которому отсекаем страницы с иллюстрациями и рекламой... Кажется, меня понесло ;-)

Далее, загоняем знание о документе, эти вектора, в базу знаний (набор векторов - матрица), ставим оценку анализу каждого столбца, делаем оценку работе в целом, для каждого документа.

Делаем пирамиду из номеров документов - ранее добавленные документы влияют на оценку добавленных позднее. Связью является доверие оценке.

В 90% случаев, связь будет положительной.

Так же, можно поделить документ на статьи и сделать пирамиду связей для отдельных статей.

Кто-нибудь еще хочет этим заниматься? :-)

C...US - это и USPS Priority и Customs form. У Priority эти

C...US - это и USPS Priority и Customs form. У Priority эти номера совпадают, а у Express - нет, у Express Customs form начинается с той же C, а вторая квитанция (которая трекинг для emspost) - с E.

В обсуждаемой посылке искомый номер EH... был на customs form просто ручкой написан. Но он был - и я по нему на таможне получал :)

Мне послали несколько дней назад посылку - у отправителя име

Мне послали несколько дней назад посылку - у отправителя именно какой-то странный custom form с номером CP....US. Трекается на сайте русской почты :) На всякий случай подписался по твоему совету - прислали тот же номер.

То что начинается с L - не трекается никак, насколько я знаю

То что начинается с L - не трекается никак, насколько я знаю.

не понял к чему тогда свой относить :) у меня с L начинается

не понял к чему тогда свой относить :) у меня с L начинается
Shipping Company: USPS
Shipment Tracking Number: LC773564483US

Смешивают, конечно, но "без фанатизма": краски сме

Смешивают, конечно, но "без фанатизма": краски смешиваются неидеально + бумага намокает (что усугубубляет проблему).
иными словами, не все комбинации "NхN" реально юзаются.

Основной вывод в том, что масштабирование нельзя доверять пр

Основной вывод в том, что масштабирование нельзя доверять принтеру (драйверу). Никаких 'fit to page' просто быть не может, только явный резсайз в нужный размер и хорошим алгоритмом (лучше бы - не фотошопом).

Ну и полезно помнить, что при печати без полей принтер тоже может растягивать и надо и это отключать.

А 360 или 720 - второй вопрос. На 720 детали есть, хотя и с очень низким контрастом т.е. о разрешении "строго 360" я бы настаивать не стал.

Алексей, а какой сухой остаток из этого исследования? Что Ep

Алексей, а какой сухой остаток из этого исследования?
Что Epson 3800 имеет физическое разрешение 360dpi?

Если я не ошибаюсь, все про принтеры Epson уже многие годы имеют это разрешение.
На этой идее основано разрешение вывода не только QImage, но и сушествующие уже много лет плагины типа PhotoKit Sharpener.

Или я все-таки что-то пропустил?

По-моему, уход цвета на этом разрешении (4-я картинка в стат

По-моему, уход цвета на этом разрешении (4-я картинка в статье) позволяет эту тему далее не рассматривать.

>Исходной задачей было удостовериться, что для моего Epson 3

>Исходной задачей было удостовериться, что для моего Epson 3800 оптимальным разрешением тоже являются 288dpi

Что-то я из статьи так и не понял, достигнута ли поставленная задача :)

Cказано про 180/360[/240/720], а про 288 - ничего. Непорядок

монохром не при чем ;) в тот же "пиксель" (5х5 точ

монохром не при чем ;)
в тот же "пиксель" (5х5 точек) принтер может последовательно наплевать каждым имеющимся чернилом (и наверняка так и делает).

1. ну ты же не представил полную модель "воркфла".

1. ну ты же не представил полную модель "воркфла". Соотв. мне и нечего объяснять "за отсутствием состава преступления".

2. при чём тут "округление позиционирования" ? ты сузил цветовую палитру. софт не обязан знать, что твой композитный цвет - это "зона особого внимания" и "отсэмпил" цвет каждого пикселя _индивидуЯльно_.
фраза "(печать с профилем принтера, конверсию делает фотошоп)" вообще загадочна - неужели из неё следует, что ресэмплинг проводился драйвером ? ,-)

Да, так понятней. Но при этом мы не должны забывать, что эт

Да, так понятней.

Но при этом мы не должны забывать, что эта арифметика работает только для монохрома.
Т.е. "200 уровней яркости" не равно "200 уровней яркости для каждого канала CMYK" (а тем более RGB), правда ?
соотв. утверждение "Итого 200, достаточно" не должно вводить нас в заблуждение - для "некоторых" цветов /*в значении hue*/ мы получим заметно меньше "200 уровней яркости".

"Winson, are we happy now?" ,-)

Ну ты не объяснил, как отличить округление в софте от округл

Ну ты не объяснил, как отличить округление в софте от округления в каретке, а начал вместо этого жевать сопли. Я и не настаиваю, жуй пожалуйста.

Для меня картина абсолютно ясна - уходы цвета легко объяснимы "тупым ресайзом nearest neigbor" (при перемасштабировании) и практически никак не объяснимы округлением при позиционировании. Куды девался весь синий из 720-dpi-ного примера?

я знаю откуда взято допущение "288" сама цЫферь не

я знаю откуда взято допущение "288"
сама цЫферь не принципиальна. Интересно "воркфло", вокруг которого эта цЫферь крутилась, и следствия, вытекающие из этого "воркфла".

об самом главном ты молчишь как пленный партизан, цепляясь к "буковкам"... полагаешь, что конкретные числа столь принципиальны, да ? ,-)
...или уже смутно догадываешься что лажанулся со своей "моделью" ?

Ну слушай, убогий: Есть растр NxM, с использованием одной ч

Ну слушай, убогий:

Есть растр NxM, с использованием одной чернилы имеем N*M+1 градаций плотности (0,1,2,... N*M плевков чернилы в пиксель).
Имея светлую чернилу мы можем сделать или не сделать ровно один плевок в тот же пиксель (набор элементов растра), получая возможные плотности (считая что у светлой чернилы плотность - половина от темной):
0, 0.5, 1, 1.5,..... N*M, N*M+0.5)

Для плевков переменного размера та же фигня. Тоже разжевать помельче, или уже сам?

угу. причём у НР, насколько помню, это были реально другие ф

угу.
причём у НР, насколько помню, это были реально другие форсунки расположенные в "межточечном" пространстве основных. Т.е. работали они на краях диапазона: когда нужно получить малую плотность (т.е. скрыть растр. i.e. "лучше поставить четыре маленьких точки, чем одну большую") и когда нужно было сделать "антиаласинг" (т.е. на краях "растра") и именно в этом качестве ("смотрите, как чётко печатается шрифт!") эта технология и рекламировалась.

Лёша, покажи убогому как-нибудь на пальТцах как оно "уч

Лёша, покажи убогому как-нибудь на пальТцах как оно "учтено". А то непосредственно "из калькуляции" это не следует. Даже напротив (один _конкретный_ пример я тебе привёл. а их, как ты понимаешь, больше чем один.)

Судя по результату, драйвер моего принтера приводит все к 72

Судя по результату, драйвер моего принтера приводит все к 720 (360 при выключенной finest detail), причем делает это весьма прямолинйно, соответственно мое допущение про 288 - не проканало, цифра другая.

1. Лёша, давай отвлечёмся от того что "я забываю"

1. Лёша, давай отвлечёмся от того что "я забываю" и вернёмся непосредственно к твоему утверждению. Ты его можешь как-то обосновать без привлечения моей "амнезии" ?

2. что касается 288dpi - это твоё число (цЫтата: <i>"Допустим, софтвер (драйвер) приводит все к 288ppi"</i>).
Вопросы остаются в силе: что значит "софтвер (драйвер) приводит все к 288ppi" ? что с этим происходит дальше ? почему удаётся печатать с детализацией выше "288ppi" ?

При попутном ветре, естественно.

При попутном ветре, естественно.

Да нет, все учтено. В простейшем случае (он неравномерен по

Да нет, все учтено.

В простейшем случае (он неравномерен по расходу чернил, но цели достигает):
дроплеты максимального размера темной чернилой ("целое")
один дроплет переменного размера темной чернилой ("после запятой")
один дроплет минимального размера светлой чернилой ("еще один бит после запятой")

угу, &quot;can produce up to three&quot; при каких услових,

угу, "can produce up to three"
при каких услових, "мин херц" ?

&lt;b&gt;&gt; ...2 градации плотности чернил - еще на 2 умно

<b>> ...2 градации плотности чернил - еще на 2 умножаем.<<</b>
ерунда.
не учтены "суммы" дающие тождественный интегральный эффект.
напр. 24*1 == 12*2 (первый множитель - кол-во дроплет, второй - оптич. плотность чернил).

Сам эпсон про эту канитель пишет иначе &quot;Variable Drople

Сам эпсон про эту канитель пишет иначе
"Variable Droplet Technology can produce up to three different droplet sizes per print line"

Ты зря забываешь, что вся эта конструкция работает в целых ч

Ты зря забываешь, что вся эта конструкция работает в целых числах (с единицей равной какому-то "минимальному шагу"). А округляя - можно и потерять разницу между 2f, 3f и 4f

Что же касается 288dpi - это не "мое" число, зачем бы объяснять что-то, куда оно входит?

&lt;b&gt;&gt;&gt; сколько градаций по выплевываем головкой п

<b>>> сколько градаций по выплевываем головкой пиколитрам не знаю <<</b>
нету градаций (принцип "всё, или ничего").
Есть принтеры с "переменным" объёмом дроплеты (те же НР ввели в обращение), но там тоже "всё, или ничего"... эпсоны не связываются с этой канителью, увеличивая кол-во красок. У рассматриваемой модели, насколько я знаю, 8 чернил: 3 градации чОрного, две маженты, два циана и один жёлтый.

Все латиницей, естественно.

Все латиницей, естественно.

а вы адрес свой как писали на сайте RRS - русскими буквами и

а вы адрес свой как писали на сайте RRS - русскими буквами или по английски?

Pages

Subscribe to comments_recent_new