О картографии (в исполнении яндекса)

А на этой картинке, дети, вы видите фрагмент карты Монголии в исполнении Яндекса:
Мы видим, как мистическим образом перемешались слова в названиях озер. Тут тебе и "нур" (классическое русское написание для бурятской топонимики, на советских картах Монголии преимущественно оно), и "нуур" (монгольское написание) и вот еще пожалуйста "лейк".

Но вот каким образом Хара-ус-нур (написание с российской карты, достаточно близко к тому, как аборигены произносят, если спросите так - поймут) стал Кар-Сша-Лейком - вот это, действительно, загадка. Сдается мне, тут какой-то двойной OCR приложил руку. Сначала с русской карты в английскую транскрипцию, а потом - обратно. С нечетным количеством ошибок каждый раз.

Update: Тоботрас разгадал. Это Энциклонги

А, да, еще по этому фрагменту. Озера "Ульгий" - нет. Там, я извиняюсь, еще один Хара-Ус-Нур (я думаю, тут дело не в бедности монгольской топонимики, а в том, что советские топографы разницы между чем-то вроде 'ус' и 'уус' - не уловили), а Ульгий - название близлежащей деревни, которой на карте нет (и не путать с городом Баян-Ульгий). Но написано - синеньким, как для озера, а не черненьким.

Нет, понятно что для Монголии даже идеи пользоваться картами Яндекса не может возникнуть, но ведь у них, поди, и для других стран - аналогичная фигня.

Comments

А всё то же. Особенно забавно на русских картах Яндекса наблюдать, как одни дороги исчезают, а другие появляются при изменении масштаба одного и того же участка карты. Пользоваться этим шедевром для планирования, конечно, нельзя.

А всё то же. Особенно забавно на русских картах Яндекса наблюдать, как одни дороги исчезают, а другие появляются при изменении масштаба одного и того же участка карты. Пользоваться этим шедевром для планирования, конечно, нельзя.

Мне очень понравилось, как Чуйский тракт внезапно становится подписан реками (река Ташантинка, река Сема).

Нет, никаких вопросов, конечно же в горах кладут дороги по руслам рек. Но если при каком-то зуме они полностью совпали, то что главнее то? Река?

смотря для кого и зачем. меня часто раздражает любовь картографов скрывать сначала реки и железные дороги. потому сто в плохо знакомом районе я их расположение обычно помню лучше, чем автомобильных дорог.

На яндекс-картах это выглядит как дорога, но подписанная рекой.

http://dil.livejournal.com/944955.html Это исправили
http://dil.livejournal.com/945361.html
http://dil.livejournal.com/947359.html С озером Эри до сих пор проблема.
Даже в России на картах фигня встречается: http://dil.livejournal.com/1075463.html

На картах яндекса хорошо показывают только пробки.
Лучше уж OSM использовать. Ее всегда подправить можно.

Конкретно для Монголии лучше всего оказался Бинг. Там направления дороги прорисованы правильнее всего, уж не знаю как они этого добились.
Ну то есть понятно, есть рельеф, реки и прочее, что мало меняется - для этого генштаб, а сверху наложить Бинг.

OSM - негодный.

Бинг почему-то явным образом разрешает OSM-у использовать свои снимки в качестве подложки для редактирования.

Возможно, они потом собирают информацию о том, как люди снимки дешифрируют, и как-то используют в регионах, где людей с интернетом и свободным временем недостаточно, чтобы OSM был годным.

Не путайте карты Бинг и снимки Бинг. Карты свои Майкрософт перерисовывать никому не разрешает, естественно. Только снимки использовать.
Предположение во втором абзаце - неверное.

Наблюдаю на границе Московской области - карты гугла прорисованы точно с OSM,
выглядит несравненно лучше карт яндекса, и относительно близко к народным картам.

Рельеф, кстати вряд ли генштаб. Скоррее NASA-вская ЦМР. Генштаб тех масштабов, которые не секретны показывает рельеф хуже той ЦМР.

Меня ж интересует не столько вообще рельеф ("с точностью 30м"), сколько "особенности рельефа" - овраги, обрывы, характер местности (болото и проч).

Пробки тоже весело показываются. Из-за дрянных навигаторов и довольно тупого алгоритма lock on road, стрелки движения транспорта частенько оказываются отображены на закрытых участках дорог, где никакого транспорта быть не может принципиально. Приблизительно то же происходит с данными от машин, которые едут по дороге, которая уже открыта, но еще не внесена в дорожный граф - их движение оказывается "приписано" к ближайшим дорогам, которые в дорожном графе имеются.

Ну, "US"->"США", логично :)

Ой.
Действительно логично.

И в Яндексе есть энциклонги!

Сегодня где-то видел статью про то, как готовились эти карты в плане названий. В общем, там эвристика на эвристике сидит и эвристикой погоняет.

Статья на Хабре. Они там всегда активно пиарятся, аудитория платит двояко - одни обожают, другие ругают карты.

А вот, например, по какой эвристике Dun Laoghaire превратилось в "Дан Лаоэр"?
http://maps.yandex.ru/?ll=-6.134351%2C53.295634&spn=0.020170%2C0.010696&...
Это и не транслитерация, и не произношение (произносится оно "Дан Лири"), а фигня какая-то.

Или вот Dalkey, которое так и произносится "Далки", почему-то стало "Долки": http://maps.yandex.ru/?ll=-6.102958%2C53.275574&spn=0.020170%2C0.010701&...

А один и тот же Dunboyne вообще одновременно и "Данбойн", и "дунбоине" http://maps.yandex.ru/?ll=-6.472983%2C53.417356&spn=0.322723%2C0.170646&...

Naas - и "Нейс" и "наас": http://maps.yandex.ru/?ll=-6.682753%2C53.219379&spn=0.161362%2C0.085722&...

И это при том, что всё вокруг вообще никак переводить не стали, а написали как есть - по-английски.

Не знаю. Я не в Яндексе и не в компании, которая делала эти эвристики.

Но так, чисто теоретически, как им удалось одно и то же название написать разными способами?

Подозреваю, сведя несколько привязок координат в одну базу.

Короче, когда в следующий раз буду проходить мимо Яндекса, зайду, поинтересуюсь подробностями.
А пока напишу большой баг-репорт :)

Скорее всего, это бесперспективно (багрепорты).
Почему - я подробно написал в комментариях к этой теме блоге автора этого журнала.

Проблемы с этими названиями, очевидно, в том, что они пополам английские и шотландские. Как они их делили (уж не по территориальному ли признаку?) - неведомо. Потому это и есть полная глупость, т.к. хотя в стране и может быть гос. язык со своими правилами, названия могут иметь самое разное происхождение. И чтобы заниматься их транскрипцией, нужно знать происхождение каждого. Что они наворотили в Бретани, с ее кельтскими названиями, слегка адаптированными под французское написание, на территории франкоговорящей страны - я даже не хочу смотреть.

Но тема перевода не странна - до нынешней весны, если верить самому Яндексу, направлением карт руководила Мария Лауфер, у которой образование - ф-т лингвистики РГГУ. "Что знаю, о том пою."

Карты Яндекса и в городах не очень. На карте Новосибирска, например, были улицы, подписанные неправильно. Я отправлял им сообщение об ошибке - исправили примерно через год.

Показал этот пост менеджеру проекта.

Ничего личного, но вот "менеджер проекта" в прошлой жизни имел хоть какое-то отношение к картам? Ну, хотя бы, как профессиональный пользователь (геолог или пехотный офицер, к примеру)....

У меня в мыслях нет никого обидеть, исключительно пользы дела для.

В картографии накоплена немалая культура за столетия, было бы здорово, если бы менеджер картографического проекта был бы к ней приобщен. Если в прошлой жизни не сложилось - ну можно потратить немного времени, скажем походить к первому курсу географов на занятия, а потом съездить на практику на пару недель. Если есть желание - могу попробовать поспособствовать.

Не знаю. Я с ней работал на прошлой работе, откуда она в Яндекс и пошла.

Если с той стороны будет желание, могу воспользоваться семейными связями и поспрашивать "как проще поучиться" (у меня сестра - доцент на географическом факультете МГУ). E-mail мой общеизвестен, я его читаю.

Ну, давайте я вам расскажу про карты Яндекса.
Первое и главное: основная задача, которая, очевидно, стоит перед всей командой - сделать как можно больше заметного (не обязательно нужного) за минимальные деньги. А по известной схеме, можно "лучше дешевле быстрее", выбрать два варианта из трех. И вот как это достигается:

Архитектура сервиса.
Граф дорог, картинка карты, граф панорам, адресная база - это все разные сущности, которые связаны между собой чисто случайно, потому что описывают они объекты, находящиеся в одном пространстве. Но не более. Когда Яндекс обновляет картинку карты, граф роутинга остается старым, при том - до года. То есть улица нарисована, но маршрут по ней не прокладывается. Потому что данные имеют еще и разное происхождение, а не хранятся в единой структуре. Это, безусловно, позволяет экономить.

Имитация деятельности.
Подпиливание интерфейса, редизайн цветовой схемы, перевод названий (вот объясните, какой у этого use case?) - все это кипучая деятельность, которая призвана создать у пользователей ощущение того, что сервис развивается. Потому что большинство пользователей всего лишь "играют" с этими картами, а не используют их в какой-то профессиональной деятельности, где точность и эффективность навигации, геокодирования и прочего означают прибыль или убыток. Туда же - организация чудесного проекта Народная Карта, где обитают фанбои Яндекса, которых компания держит при себе для поддержания положительного образа. А на самом деле - кидает их, потому что данные из НК в карты не попадают совсем или почти (то, что есть сто лет как в НК, на карту не попадает годами). Скорее всего, информацию из НК вообще непонятно как использовать в контексте легальности сервиса, потому НК и остается "кормушкой для хомячков", желающих почувствовать себя причастными к чему-то большому.

Собственно карты.
Раньше Яндекс покупал данные и только конвертировал их в свои форматы, а потом использовал и показывал. Что было отражено в копирайтах карты. Потом в Яндексе решили, что это неэффективно. И они купили конторку ГИС Технологии, которая раньше была в составе известной конторы JJ Group, наводнившей в свое время Россию дешевыми дрянными китайскими навигаторами (и не менее дрянными картами к ним, сделанными из данных Роскартографии) и радиостанциями под маркой JJ Connect. Напомню, что организована эта контора была отцом и сыном Жалковскими, из которых старший занимал какое-то время пост руководителя Роскартографии. Так вот эта контора ГИС Технологии, влившись в команду Яндекса, начала активно поставлять сервису карты, изготовленные по традиционным для JJ методам - взять масштаб похуже и подешевле, нанять фрилансеров-студентов за копейки, дать им снимки, а назад получить "карту с улучшенной детализацией", то есть туда просто оказываются пририсованы детали со снимков. Без всякого уточнения на местности и так далее, что легко видеть, если знаешь местность. Полно там "угаданных" дорожек под деревьями, которых на самом деле нет, и так далее. Но, поскольку контора имела уже (благодаря Жалковскому-старшему) все полагающиеся лицензии, она может брать любой мусор (а что фрилансеры могут наклепать - это можно себе только представить, плюс еще никто не знает, что именно они по личной инициативе могут использовать, как доп. источники - викимапию, гугл и т.п.) и легким движением превращать его в легальную карту. Вот откуда карты России у Яндекса.

Забавная диалектика.
Штука в том, что по аналогичному пути пошел какое-то время назад и Гугл. Контора "ГИС Инновация", числившаяся какое-то время в копирайтах на картах России в Гугле - родная сестра "ГИС Технологий", родители те же - JJ Group. Методы - аналогичные. Только сами технологии и организация данных - гугловские, потому не такой ужас в итоге получается. Но фантазий тоже полно.

Так что я глубоко сомневаюсь, что вопрос там в образовании или чем-то еще таком - просто задачи стоят совершенно не те, и критерии качества далеки от тех, которыми оперируете вы или я.
Имитация деятельности - это одна из наиболее гнусных черт нынешней России, так что лично я просто из-за одного этого с Яндексом "на одном поле не сяду".

Вот такая история.

В случае с Яндексом (и не только с ним) - у меня же долгая история отношений, я с ними "знаком" с момента, когда в Рамблер пришел работать.

И таки да. Если сначала на замечание "у вас косяк" - говорили "ой" и за пару дней (или какое-то другое разумное время) исправляли (и просто пожаловаться в моем блоге/ЖЖ - работало, притом не только в моем, они это мониторили), то сейчас оно действительно иначе, нужно очень громкую волну поднять (и моих усилий недостаточно), чтобы она дошла до самых топов, а уже сверху прилетел окрик "починить".

А имитация деятельности, да, задолбала до ужаса. Понятно откуда она возникает в средних-больших компаниях (но от этого не легче), но всякий раз обидно, когда из хорошего маленького стартапа вырастает ТАКОЕ.

Я пробовал "троллить" их на Хабре, где они пиарятся - по громким примерам они отрабатывают (видимо, Хабр - площадка, за которую тамошние пиарщики несут ответственность) и даже местами не игнорируют, а пишут "мы работаем над этим" и прочие общие отмазки, если спрашивать их про какие-то принципиальные технические проблемы. Но практического смысла в том, чтобы их заставлять исправлять единичные случаи, я не вижу - еще в тысяче мест будет фигня. Или в следующей версии будет фигня.

Ровно также работает Навиком, который делает "официальные" карты для Гармин - просто периодически покупает новую основу у поставщиков и конвертит. Потому им бесполезно слать багрепорты - в следующей major-версии все исправления пропадут (если какие-то не исправит совершенно независимо от этого сам поставщик). Навикому карты нужны, чтобы продавались навигаторы.

Наличие табунов фанбоев среди айтишников (которые вроде должны обладать чуть большей устойчивостью к бреду) тоже не веселит. На том же Хабре можно за критическое замечание уйти в минус.

Тут две разных темы, одна про карты, а вторая - вообще про менеджмент.

Если, в силу понятных процессов, в менеджеры проектов в Яндексе выносит таких людей, которые имитируют деятельность (лучше пишут отчеты), а не делают принципиально хорошо (а признаки этих процессов имеются многочисленные, не только в картах, а вообще в Яндексе), ну обидно, "испортили хорошую вещь". Но эти процессы, увы, почти всегда происходят при росте компании, потому что обратная связь наверх - по отчетам, а не по тому, что реально сделано. Я за это не люблю большие компании.

Но вот более частный вопрос с картами, скажем про подпись дороги протекающей в 10 метрах рекой, - это именно про недостаток картографической культуры. Достаточно пяти минут взгляда на карту, чтобы увидеть эту херню. И эта частность - лечится образованием, что я и предложил.

Что касается "фанбоев среди айтишников", увы. Айтишники, за рамками своей специальности, легко ведутся на всякую фигню. Ибо безблагодатность образование такое.

Хм, я чуть более категоричен и не верю в доброго царя, то есть добрых и правильных руководителей.

Скорее, предполагаю, что не могут без согласия высшего руководства на должности пониже сесть хрен знает кто (см. соседний пост), не имеющие о качестве и принципах организации карт (то есть предмета, поставляемого сервисом) никакого понятия. Зато имеющие понятие о том, что конечному потребителю, за исключением отдельных, плевать на качество, а главное - постоянные обновления.

Новый порошок "Лоск" - теперь в новой упаковке! - это даже не Новый порошок "Лоск" - с лимонным запахом!
Для массового пользователя достаточно и упаковки. Я уж молчу про то, чтобы новый порошок что-то действительно лучше отстирывал.

Вот это вот осознают и эти Маши, и высшее руководство.
А правильной автоматической расстановкой названий занимается в одно лицо г-н Максим Рыков в Университете Гейдельберга (это который слой Mapsurfer на openstreetmap.ru, например).

Ну я вот сам, правда в очень небольшой степени, был этим самым "добрым царем". А точнее, злым следователем, пытавшимся всякую херню истребить.

Как только у вас структура перестает быть совсем плоской (т.е. больше ~15 человек в команде), появляется иерархия, так сразу вы вместо реальных результатов, которые можно непосредственно пронаблюдать, начинаете видеть отчеты. Иначе невозможно, не хватит сил и времени. Дальше можно выборочно смотреть на реальные результаты, хвататься за голову и пытаться конкретное место исправить.
Я это и наблюдал и делал. Но мне это не нравится, поэтому я не в "группе компаний" работаю за зарплату, а в нано-стартапе из трех человек.

Проблема лживой обратной связи встает тогда, когда те, кто ее должен давать - негодные специалисты. А сформулировать свои реалистичные требования к ним - это как раз в рамках компетенции высшего руководства. Частенько выходит, что хотят "и швеца и жнеца", то есть чтобы и в картах разбирался, и менеджером был. Так не бывает, потому проще оказывается найти менеджера-трепача, который как та Маша, "лучше всего умеет разговаривать с людьми", а потому легко объяснит, что специалист по картам вообще не нужен. При грамотном подходе это должны быть два человека - коммерческий и технический руководитель направления, и чем более они будут полярны - тем лучше для конечного результата. А банальная лень, боязнь конфликтов и жадность руководства такие фокусы проворачивать не позволяет.
Это и на низком уровне управления точно также работает, когда, скажем, "разработчик с навыками SEO" оказывается в результате просто сеошником, который спихивает разработку коллегам или вообще на аутсорс, получает зарплату за полторы должности а результат от него - не более чем на половину от требуемого. Выход - не жадничать и брать двух разных людей.

Нет-нет, все сложнее.

Во-первых, "годных специалистов" негде взять, их может просто не быть. Приходится ковать из тех, кто есть. Доучивать, тренировать и проч.

Во-вторых, дорастание до уровня некомпетентности никто не отменял, оно всегда происходит. И одно дело быть "финансовым директором" в компании из трех человек, а другое - из трехсот. Да, надо пересаживать и все такое, но не надо делать вид, что это просто.

В-третьих, на разных этапах жизни компании - нужны совершенно разные люди. В компании из трех человек действительно нужен "разработчик с навыками SEO и привычкой к тестированию" (но настоящий разработчик с настоящими навыками, а не муляж), потому что "отдел разработки", "отдел тестирования" и "отдел SEO" в трех человеках никак не поместятся (есть же еще генеральный, финансовый ну и президент по уборке территории). А потом они должны разделиться, как амебы, с одной стороны мы можем брать узких специалистов, а с другой - резко возрастут затраты на коммуникации.

Кризисы роста - неизбежны, если есть рост. При наличии опыта у руководства - они преодолимы легче, но если речь про стартап выросший в тысячу раз (вот у Яндекса порядка миллиарда евро в год ревеня, в 2000-м было вот примерно на 3 порядка меньше), то откуда взяться опыту - это единственная такая компания у CEO, очевидно.

Я не отрицаю сложностей.
То, что я описал - предельные случаи и некие существенные частности. Если ко всем этим замечательностям хоть пытаются стремиться - хоть что-то из них будет давать результат и будет заметно.

В случае с Яндексом, очевидно, финансовая проблема не стоит, так что могут себе позволить. Вакансия руководителя направления карт висела у них долго (может и сейчас висит), и там был как раз швец и жнец был описан. По возможностям они уже давно не стартап. И, судя по Грегу Абовски, могут себе позволить даже иностранных менеджеров.

Но если желания стремиться к правильному нет, то правильное никогда не образуется. Вместо него образуется повышение доходов за счет снижения расходов на реальный продукт путем его имитации. Что мы и имеем.

Про менеджеров проектов. В МойКруг, конечно, бардак, но:

http://mlaufer.moikrug.ru/ - Мария Лауфер, Руководитель сервиса Яндекс.Карты Ноябрь 2008 Март 2013
Образование: РГГУ-Москва (Российский государственный гуманитарный университет), Москва, Специалист, ф-т ИЛ - Теоретической и прикладной лингвистики 1998 2003
Специализация и профессиональные навыки:
Лучше всего я умею разговаривать с людьми.

http://npleshkova.moikrug.ru/ - Наталья Плешкова, Менеджер проектов, Геоинформационные сервисы, Август 2009 настоящее время
Образование:
МГУ (Московский государственный университет им. М.В. Ломоносова), Москва, Магистр, ф-т Химический, 1998 2003, органическая химия, диплом с отличием

Интервью про карты сейчас дает некий Андрей Стрелков - у него, правда, на http://strelkov-andrey.moikrug.ru/ про карты ничего не написано. Но он тоже не картограф, а электронщик (видимо), правда, я тоже почти электронщик, но и в Яндекс рулить сервисом не иду.

Вот вернусь домой с Непала, посмотрю, чтони про Гималаи наколбасили ;)

Так, для примера в тему, дискуссии в OSM на тему перевода названий:
http://forum.openstreetmap.org/viewtopic.php?id=16626
http://forum.openstreetmap.org/viewtopic.php?id=19805 (там есть вот такое, например http://forum.openstreetmap.org/viewtopic.php?pid=306128#p306128 )

Я, конечно, слоу, но только зашел почитать. Самый адок этой "транслитерации" наблюдается в Румынии.
Мало того, что названия населенных пунктов со строчных букв начинаются, так еще и волшебные буквы (аналог русской ш) и (аналог русской ц) вставлены в "русские" названия как есть.
Ну и город Галац, упоминавшийся в таком произношении еще во времена Русско-Турецкой войны, про который есть даже статья в русской Википедии, неожиданно стал Галаты, едрен батон.
Один плюс, в Румынии появились-таки дороги, т.к. в предыдущей версии карт дорог, не входящих в европейскую классификацию, там не было вообще.