Стал доступен широкой публике (на английском, на русском) доклад компании "Яндекс", подготовленный для конференциии WWW 2009, прошедшей в конце апреля в Мадриде. В нем говорится о новом методе идентификации платных ссылок, разработанном на основе алгоритма HITS, ранее использовавшегося для выявления спама.
При этом в докладе отмечается, что платные ссылки "не считаются спамом, поскольку встречаются в основном на вполне приличных страницах наряду с другими полезными ссылками и часто указывают на ценные коммерческие сайты". Тем не менее, умение выявлять платные ссылки значительно повышает эффективность рейтингов поисковых машин, отмечают представители "Яндекса".
Аккуратный подход к проблеме платных ссылок (и отношений оптимизаторов с поисковой системой) демонстрирует следующая фраза: "Главная задача алгоритма — выявление непосредственно платных ссылок, а не сайтов, их продающих и покупающих".
Проверка алгоритма на сформированных вручную тестовых выборках доказала его высокую точность (95%) и эффективность (93-96%). Удивительным открытием, которое можно сделать на основе материалов доклада, заключается в том, что "Яндекс" считает платные ссылки более вредными в некоммерческих запросах, а не по популярным конкурентным запросам, где и размещается значительное число платных ссылок:
"Идентификация платных ссылок позволяет оценивать релевантность ссылок для коммерческих и некоммерческих запросов независимо друг от друга. В первом случае, платные ссылки учитываются при вычислении коммерческого рейтинга, а во втором — игнорируются. Это делает формулу вычисления рейтингов более эффективной и повышает качество поиска, нейтрализуя влияние чрезмерной оптимизации на некоммерческие поисковые запросы и делая результаты поиска более разнообразными".
Отечественные блогеры уже попытались "перевести" это заявление на простой язык. В частности, разработчик поиска Леонид Бойцов пишет: "По поводу некоммерческих запросов, идея, видимо, такова. Поскольку покупные ссылки сильно поднимают рейтинг страницы, то по некоммерческим запросам оптимизированные страницы начинают выплывать там, где они не (очень) релевантны. При этом обычный контент не может с ними конкурировать. У коммерческих запросов другая история - там есть огромная конкуренция. В результате, по каждому коммерческому запросу есть много релевантных результатов, а пользователю может быть не так важно, какие именно компании выплывают по запросу "поставить окна".
Новости / "Яндекс" разработал новый алгоритм выявления SEO-ссылок
- 21.05.2009 14:08:31
Новости
- Бандлософт помог Mail.ru нарастить долю поиска 16
- Бегун перепродаст рекламу в социальных сетях. 3
- В русской Гуглопочте заработали звонки на телефоны 12
- Mail.ru перетряс кадры и политику 25
- "Мастерхост" отключился от пользователей 21
- Русский Airbnb откроется 1 февраля 5
- Facebook пошёл на стомиллиардное IPO 16
- Юрий Мильнер: b2c интернет — не "пузырь" 15
- Google вытесняет конкурирующие соцсети из SERP 10
- Скончался Александр Житинский 6
- "Перекресток" открыл свой онлайн-магазин 11
- Google объяснит пользователям, как они делятся информацией сами с собой 1
Инсайды, Слухи, Открытки
- Инсайд: Лаборатория Касперского отказалась от IPO 13
- Генеральный директор HFLabs на собеседованиях издевается над программистами 15
- Mail.Ru Group объявляет о приобретении RuTwit.ru 6
- Риски, деньги, принципы. Подборка самых интересных публикаций об IPO Facebook 11
- Ozon.ru может купить обувной магазин Sapato 43
- Публичный саппорт: Интернет-банк "Связного" - баг или хак? 21
- Крупнейший рекламодатель России (Procter&Gamble) разгонит маркетологов и уйдет в соцсети 10
- Почему у Яндекса до сих пор нет голосового поиска? 34
- Сергей Спивак переходит в Internest 4
- Enter.ru привёл технического директора из Google 8
- Публичный саппорт: у Яндекса опять сломалась ПДД 13
- У Яндекса появится карта мира от Navteq 2
Новые комментарии 
- Ashmanov > Пост о том, как некий Сергей в Яндекс работать устраивался (188)
- Alter Ego > Бандлософт помог Mail.ru нарастить долю поиска (16)
- Alter Ego > Инсайд: Лаборатория Касперского отказалась от IPO (13)
- Psycho > Facebook пошёл на стомиллиардное IPO (16)
- Alter Ego > Бегун перепродаст рекламу в социальных сетях. (3)
- Alter Ego > Генеральный директор HFLabs на собеседованиях издевается над программистами (16)
- Alter Ego > А.Носик разоблачает связи Кремля и киберпреступников(ЖЖ) (26)
- Alter Ego > Риски, деньги, принципы. Подборка самых интересных публикаций об IPO Facebook (11)
- lyalius > Пост о том, как некий Андрей учил Яндекс жизни и был уволен (12)
- barouh > Крупнейший рекламодатель России (Procter&Gamble) разгонит маркетологов и уйдет в соцсети (10)
- Zemant > Mail.Ru Group объявляет о приобретении RuTwit.ru (6)
- sinodov > В русской Гуглопочте заработали звонки на телефоны (12)
- Crio > Free-lance.ru огорчил Дурова (12)
- Alter Ego > Сергей Спивак переходит в Internest (4)
- vnaz > Mail.ru перетряс кадры и политику (25)
- Psycho > Ozon.ru может купить обувной магазин Sapato (47)
- T0XA > "Мастерхост" отключился от пользователей (21)
- trin > Публичный саппорт: Интернет-банк "Связного" - баг или хак? (21)
- botnet > Почему у Яндекса до сих пор нет голосового поиска? (34)
Комментарии
Это "постер"
Доклады не являются постерами, постеры не являются докладами
Требования к качеству работы на настоящих сессиях и на постерных абсолютно разные
это не демонизирование)
это всего лишь взгляд на бизнес с точки зрения бизнеса
А почему Яндексов и Гуглов не должно это бесить ? Особенно в период затягивания ремней и корсетов.
СЕО-торговцы платными ссылками, получают прибыль с аудитории, часть которой могла бы идти "правильным путем" Адсенса и Яда.
Вполне понятно, что пока слон большой и жирный, проблема глистов его мало волнует.
Но вот неурожай, слон отощал, и на клубок мелких червячков, пользующих большого друга за здорово живешь, смотрит уже как на врага.
Хотя доклады не являются постерами, а постеры тостерами, Вы все же не правы :) и этот наезд на яндекс не очень к месту :(
А большой бизнес привык руководствоваться не эмоциями, когда кто-то "бесит", а соображениями прибыли и долгосрочного развития.
Кстати, интересно было бы узнать, насколько мощными остались скачки роста продаж Директа после каждой смены поискового алгоритма... :)
Яндекс делает неплохую работу по русскоязычному поиску, за это я его очень уважаю, причем тут "наезд"
Просто настоящая публикация и постер (стендовый доклад) это две совершенно разные несоизмеремые вещи и я поправил человека, написавшего этот пост.
Постер это обычно работа, отклоненная от главного потока, но в силу каких-то причин ПС решает предложить автору доложить ее в постерной сессии. Если автор понимает, что работу он может улучшить и опубликовать на настоящей конференции, он отказывается. Если понимает, что сказать нечего, то идет на постер. Обычно постеры считаются отрицательными пунктами в резюме, если вы не студент 1-2-3 курса.
На стенде есть отличная возможность поговорить с заинтересованными людьми и обсудить какие-то частные проблемы, которые не вписываются в вопросы/ответы (а подойти в частном порядке те же люди могут и полениться).
И уж во всяком случае постер продуктивнее 10-минутного доклада на сессии.
Нет.
Просто аккуратные новости на главной странице лучше смотрятся. Есть понятия доклад и стендовый доклад.
просто во всем аккуратность нужна. Ну, никак постер за доклад не считается. Я когда оцениваю нового кандидата, постеры даже не считаю, хотя надо бы их минусовать.
Кстати, не первый раз. Мне какой-то яндексоид тоже помню говорил про "статью на СИГИР", а потом когда я проверил эта "статья" оказалось постером, там была какая-то совсем примитивная линейная модель для новостей
Интересно, есть ли у Яндекса достаточно инноваций, чтобы хватило хотя бы на одну статью (ср с Яху, Микрософт, Гугл)
Какая реакция ожидается: "дрожу" или "ржунимагу"?
У меня лично первая что-то никак не выходит.
Большинства статей в SIGIR/WWW написано на "исследовательский бюджет" равный зарплате постдока (в Европе примерно 2500 тыс евро в месяц) и минимальное оборудование в виде парочки компьютеров
У этих постдоков нет и в помине того, что есть у Яндекса, Гугла, Микрософота (датацентров, огромных текстовых коллекций и всевозможных данных извлеченных из них). Тем не менее как-то пишет без всяких особых "исследовательских бюджетов".
1. Про большинство как-то не уверен. Одно из эг справедливо заметило, что доля текстов из гигантов индустрии (в т.ч. поисково-провального MS) весьма высока :)
2 ( =считаем чужие деньги :). Да, 2.5. Плюс гранты и, по-советски говоря, хоздоговора. Тысячи четыре (евро, а того хуже, фунтов выходит) выходит, что позволяет работать, не дергаясь про прокормку и не уточнять порядок различия (20-ичный, 30-чный) своих доходов и доходами удаков из того же института/университета (ситуация чисто российская и правда не характерная ни для Европы, ни для того же Китая, где удаков ничуть не меньше, но вот как-то в науках :) живется им заметно хуже, чем у нас). У некоторых (не у всех!) в университетах получается заметно больше, в т.ч. больше, чем в индустрии.
Это какая-то российская практика. Постдок обычно сидит на один проект, который оплачивается NSF еврокомиссией или кем-то еще
Несмотря на то, что на рынок они вышли совсем недавно, а поисковый отдел в Микрософт сравним по размеру с поисковым отделом Яндекса. Просто рынок уже поделен, и почти невозможно добиться выигрыша в аудитории предлагая тоже, а не гораздо лучшее качество продукта.
Есть еще вопрос маркетинга.
А при чем тут бюджеты к "нанять"?
Лаборатории Яндекс под Сан Франциско предлагали экстра-приличные зарплаты и тем не менее никого из звезд не наняли. Просто деньгами вы сильных ученых или разработчиков не купите.
Но я говорю про исследовательский отдел в целом. Чтобы Яндексу СЕЙЧАС можно было публиковать действительно сильные работы, нужно было этот исследовательский отдел лет 10 кормить, холить и лелеять. Всячески поощрять публикации и давать возможность делать исследования. Очевидно, что ничего такого себе Яндекс позволить не мог.
Извините, у меня ассоциации с “наши люди в булочную на такси не ездят” (я, правда-правда, не обидеть хочу, просто такая ассоциация :).
Я не знаю, как оно в “приличных университетах”. К примеру, в Британии академический IR — это Glasgow U.. Queen Mary U. или Open U., но никак не Oxford или Cambridge(универ, не MS Cambridge).
К тому же я говорил, что ~2.2 килофунта безнапряжно превращаемы в ~3.5, а вовсе не в 35.
русский студент из Голландии в прошлом году опубликовал три статьи на SIGIR сразу
И это все без всяких "лелеять, холить 10 лет", средств и датацентров. Это как разруха, тут все дело в голове, а не датацентрах и деньгах .
да никто не превращает эти 2.2 килофунта в 3.5
Это Вы видимо по-российской практике судите, может по своей левой конторе в Австралии, не подрабатывают постдоки на левые проекты.
А чего этого нет у Яндекса? Статей? А почему они у него должны быть?
Зачем Яндексу "публиковать сильные работы"? От амбиций? Чтобы поощрять сотрудников? Слабые мотивы, вообще-то. Вот IBM постоянно массово публикуется, раз в год объявляет об очередном создании ИИ, имунной системы компьютера и т.п., и что?
Может, у московского метро тоже маловато научных публикаций?
По-моему, вы жанры смешиваете. Яндексу нужно долю рынка удержать, а не искать "сильных", а скорее писучих людей, чтобы они публиковались в рабочее время.
Чтобы Яндексу СЕЙЧАС можно было публиковать действительно сильные работы, нужно было этот исследовательский отдел лет 10 кормить, холить и лелеять.
Как вы отличаете "сильные работы"?
Если студент, аспирант или постдок напишет какую-то статью, которая выглядит умной и инновационной, то из чего следует, что предложенный подход заработает в реальной жизни? Судьи кто?
Ведь для статей основное - сам факт публикации N статей в год, это такая валюта у постдоков и профессоров.
Я понимаю публикации в химии там или физике, их можно проверять и применять.
А где применять "сильную статью" про IR на SIGIR? В трёх поисковых компаниях в мире?
Тогда эти статьи имеют второе применение - служат резюме для подачи в Гугл. А куда ж ещё.
Мне вообще кажется что в поисковой отрасли, в этом самом IR, никакой большой науки вообще нет, бльше прагматика с небольшим количеством арифметики, всё как раз прикладное, включая тот самый Pagerank и т.п. Ну, есть какие-то методы оптимизации, статистики. Ну да. Успех-то здесь не от науки.
2 ашманов -- я так понял, вывсячески порицаете ребят из яндекса, сделавших постер? Да не убивайтесь вы так :)
Игорь, мне кажется Вы упорно мешаете мухи с котлетами. Во-первых, есть публикации с уклоном в эмпирику, а есть с уклоном в алгоритмику. Но Вы последних, видимо, просто не читаете. Поэтому считаете, что их совсем нет, как метро в Париже. Результаты этих публикаций могут применяться не только в текстовом поиске, но и, например, в молекулярной биологии. Да что там говорит, алгоритмы текстового поиска ваяют даже контракторы для министерства окружающей среды США. Конечно, вопрос внедрения публикаций в жизнь непростой и неоднозначный. Да, большая часть публикаций мало кому нужное унылое говно. Да профессорам надо публиковаться много. Но изюминка-то тут в том, что звезды публикуют много хороших публикаций и их за это любят и знают, берут возглавлять отделы поиска, как Уди Манбера или Баеза Йайтеса, а посредственные прозябают.
Ну и напоследок про исследовательские отделы, который Вы Игорь так презираете (видимо, на примере советской науке). Яндексу, Гуглу и Майкрософту НУЖНЫ люди, которые знают как делать инновационные проекты, такие поиск по изображениям, распознавание речи и пр... Проблема-то в том, что такие люди все обычно с академическим уклоном, а не программисты. Для них среда нужна, без среды они зачахнут. А среда - это дело дороге. Люди должны постоянно читать и писать, быть в курсе тенденций, а не блоги программировать, а в свободное время изредка почитывать литературу.
Вы зря принижаете Яндекс. Яндес очень хочет вносить фундаментальный вклад. Именно из этого желания зародилась Школа Анализа Данных. Там читает лекции статистик и теорвещик Ширяев, а не программист Вася, который владеет перлом. И Райгородский со своими людьми и весьма немалым бюджетом, занимается вовсе не программирование поиска по блогам.
Одна из больших проблем подобных статей это неверифицируемость результатов. С этим решили бороться на SIGMOD (http://www-rocq.inria.fr/~manolesc/PA...ility.pdf), ученые могут публиковать исходный код и данные, используемые для проверки алгоритмов
Надеюсь со временем в WWW/SIGIR сообществе займутся тем же
Я ничуть не принижаю Яндекс, наооборот, хвалю его, как весьма практичную компанию. По поводу того, что Яндекс хочет внести фундаментальный вклад, а не просто обучить сотрудников основам магии, хочется верить, но... замена Интернет-математики на конкурс для программистов и отсутствие значимого количества публикаций, наводит меня на мысль, что не очень-то и хочется. Я, конечно, мог бы предположить, что Яндекс просто не может совсем и, что у него нет для этого ресурсов, но, очевидно, это не так. Скорее всего, не очень хочет. Или, скорее всего, какие-то люди в Яндексе хотят, а какие-то нет.
> игорь презирает
я понимаю, что такой "солипсизм" (из нашей деревне никто не был в Лихтенштейне, значить и никакой лихтенштейны нет и не нужна она) возможен, хотя и потешен. но я не очень понимаю, когда типа-защищая яндекс (ашманов в своем посте защищает?) человек вместо защиты обсирает. правда, какие-то неустранимые проблемы с логикой. или передергивание -- отличие всех, кто возле власти трется (в надежде ;)
Более умного, яркого и преданного пропонента Яндекса, чем Ашманов Вам не найти
> эффективность (93-96%)
Молодежь, сразу видно. Ребята, представляя алгоритм впервые, надо называть цифры полноты и точности в 85-90 %. Через год - 89 - 92 %. А 95 % и полноты, и точности называть не надо вообще никогда, ибо на практике они всё равно недостижимы. Ничего, со временем научитесь писать научные статьи.
А в соседнем треде меня ругают за нападки на Яндекс, и лично Сегалович говорит. что ему я отвратителен и велит заткнуться.
... отличие всех, кто возле власти трется
Это про меня, что ли? Ну и как же я это делаю?
Вы даже не поняли, что я сказал - то ли я защищаю Яндекс, то ли "обсираю", и решили, что проблема с логикой у меня, а не у вас. А проблема у вас: вы считаете, что можно либо защищать, либо обсирать. Эта ложная дихотомия не даёт вам ничего понимать в реальном мире.
А, нуда, ещё вы. как я понял считаете. что всё, что тут говорится, надо объяснять интересами. Власти, Яндекса и т.п.
Вам нужно протереть своё закопчённое стекло.
Я говорил дословно следующее: здесь заняли очень странную позицию: хорошо, когда интернет-компания много публикуется. Дальше стали обсуждать, дураки ли в Яндексе, могут ли они претендовать на что-то кроме жалкого постера и т.п.
Ребята, у вас основная посылка неверна. Ничего не показывает количество публикаций относительно качества интернет-компании. Академический мир и мир реальных массовых проектов между собой почти не связаны. Не может Яндекс много публиковать. а если какой-нибудь Гугл много публикует, это значит, скорее всего, что у него завёлся жирок, который он сейчас в эпоху кризиса и почистит.
Много ли публикаций у Фейсбука и зачем они ему?
И трансфер мозгов из академического мира в прикладной происходит обычно в виде чтения статей и попыток их применения, либо - как у Гугла. Нашли идею - сделали стартап. А не поехали на SIGIR с нею. Если есть запал делать, а не публиковаться.
Изредка учёного берут в какой-нибудь Microsoft Research, где он прямо в интервью говорит "у нас полностью академическая атмосфера, за одним отличием - много бабла" (это реальная цитата из Мирвольда). Ну и результаты потом соответствующие - никакие.
И опубликовались в урезанной форме типа "The Anatomy of ...." для маркетинга, а не для PhD.
Да, у Яндекса есть амбиция публиковаться и быть научным центром. На мой взгляд, она скорее вредна, но это их проблема. Если для маркетинга и недорого - нормально.
из фейсбука ненулевое количество публикаций ("как наши мемкэшеды обрабатывают 10 миллионов транзакций в секунду") и они достаточно любопытные, когда пробегают мимо - я с удовольствием читаю.
Помимо маркетинга, это должен быть еще неплохо работающий способ найма технарей.
Смотря что за конференция. На нормальных конференциях типа той же WWW стендовые доклады нередко бывают интереснее сессионных.
> В условиях полного пофигизма к IR
Это в "Яндексе" полный пофигизм к IR? Смешно.
По существу:
> Вам нужно протереть своё закопчённое стекло
Спасибо за очередное и, прямо скажем, с неожиданной стороны, напоминание. Уже лет пять все собираюсь сделать очки. И все никак :(
Не по существу:
> если какой-нибудь Гугл много публикует, это значит, скорее всего,
Я так понял, это очередные фантазии на тему как-там-у-них. В Google человек просто не имеет права печататься на “неотвлеченные” темы. Откуда практически ПОЛНОЕ ОТСУТСТВИЕ IR-работ из Google.
PS Надеюсь, вы все же позволите ребятам из яндекса делать работы :) и не станете — не в период затишья, а как раз после очередной нормальной работы :) — убеждать, что отсутствие работ на полноценных мероприятиях [желательно, в комбинации их с наличием на мухосранских] есть главный предмет мужской гордости ;) Не будьте столь жестоки :)
Во-вторых, чем это помогло Фейсбуку - не умение обрабатывать зиллионы запросов, а рассказ об том всему миру?
Да, в смысле найма и удержания специалистов (которые могу себе льстить, что они вот ещё и выступают/публикуются) - наверно, полезно. Ну так это пиар такой. Один из видов.
Вспомни мотивы. по которым в Яндексе разрабатывались Спамооборона, Яндекс-Сайт и ещё кое-какие отчуждаемые программы. Они были простые - хотелось чувствовать себя также и разработчиком ПО. Это же круто.
А бизнесу это было просто вредно - отнимало ресурсы, размывало фокус. У Гугла с его поисковиком - та же фигня наверняка, тоже чистые амбиции. И тоже результаты близки к нулю в сравнении с основным бизнесом.
Ну вот и со статусом "научного лидера", "центра исследований" - то же самое. Ну если пиар-люди одобряют, это недорого - почему нет.
Как инструмент найма ("они там не только гламурные менюшки рисуют") должно работать, кроме того это демонстрация "технологического лидерства", которую прекрасно можно пиарить.
Кроме того, публикации - прекрасный маркетинговый инструмент. Работает, конечно, если есть гики (и журналисты), которые оказываются точкой влияния на массовую аудиторию. Вот PageRank - прекрасный ведь пример, на практике сегодня - уже работает плохо, однако в мозгах засел. Байес вот тоже.
Яндекс - это всего лишь Яндекс, а не вся Россия.
Да, кстати, публикаций из Гугла совсем немного, особенно по сравнению с валом статей из Майкрософта или Яху, например. При том, что число исследований, проводимых в Гугле, явно не меньше, чем в том же Яху, просто предназначены они для внутреннего пользования.
Т. е. уже не полный пофигизм все-таки? Есть лучи света в темном царстве?
И что не так с IR в России? Разве мало людей им тут интересуются? По ощущениям - совсем немало.
Судя по явлению iRman, твой, Леня, itman, оказывается, -- бренд. Скоро it_man и itman_ полвалят (с IR-фальсификатом?)
Технические науки - тоже науки. Пишутся же технарями диссертации с названиями типа "Модели, методы и программное обеспечение для построения объединенного интернет/интранет сервера организации".
Я в курсе. Я сам диплом на Мехмате защищал на тему "Об асферических копредставлениях подгрупп свободной группы и одной проблеме Филипа Холла" и статьи в журналах были такие же, по теории групп, а вот диссертацию на ктн - уже на тему "Разработка и практическая реализация промышленных лингвистических систем на примере грамматического и стилистического корректора ОРФО" или что-то в этом роде.
Так вот работ первого рода ждать из интернет-компании глупо (они будут частным делом сотрудников), а второго рода - тоже не очень осмысленно, потому что копирайт, коммерческая тайна и пр. В любом случае, чаще всего самых интимностей там точно не будет. Будет что-то в стиле "ну, ква".
Следовательно, сами работы будут для того, чтобы греть эго сотрудника, а иногда и руководителя компании ("у нас очень умная компания").
Если это входит частью в построение пиар-имиджа "умной инновационной компании" - нормально. Ничего плохого в этом нет. Но тогда разговоры в стиле "а вот у этих много работ, а у этих мало" означают, что вы повелись на эту пиар-компанию.
Есть ещё вопрос патентов, он совершенно по-другому устроен, по-другому связан с бизнесом и мотивации там другие, но это отдельный разговор.
Из моей области, несколько лет назад в Гугл в ушел один из лучших и продуктивных ученых в области machine learning Томас Хофман. Сейчас он публикуется заметно меньше, чем во время своего академического периода, но что-то публикует, написал весьма неплохую книгу с Бакиром.
Ученый из Гугл вместе с ученым из Яхуу! написал и опубликовал Search Engines: Information Retrieval in Practice, W. Bruce Croft, Donald Metzler, Trevor Strohman. Весьма важная публикация для подготовки молодых ученых, отлично совместима с другой новой отличной книгой по ИР, написанной Маннингом. Обе заменяют весьма устаревшую книгу Байеза-Йетса.
А вообще этот список довольно большой (например, гугловский Бар-Йосеф делает много важных работ по оценке индекса поисковых систем)
http://research.google.com/pubs/Infor...ieval.html
http://research.google.com/pubs/Hyper...heWeb.html
А вот это неплохой и непростой вопрос
Фейсбук рассказал по всему миру. Микрософт, Яху и Гугл рассказывают и делают еще много чело полезного. Гугл поддержал талантливых студентов
Программа им Аниты Борг для талантливых студентов в информатике
http://googleblog.blogspot.com/2009/0...s-and.html
Просто поддержка лучших студентов в информатике
http://googleblog.blogspot.com/2009/0...htest.html
тем же занимаются ИБМ, Микрософт, Яху!
Микрософт имеет целых четыре программы поддержки студентов
просто талантливые студенты, женщины, меньшинства, и студенты с проблемами здоровья
http://www.microsoft.com/college/ss_overview.mspx
Ашманов спрашивает зачем тратить деньги не на бизнес? Зачем "вбухивать" драгоценное "бабло" на что-то помимо компании? Есть ли ответ на ашмановский вопрос?
Мне кажется
помимо студенческих програм
Микрософт поддерживает аспирантов в Европе
http://research.microsoft.com/en-us/c...urope.aspx
Микрософт оплачивает полностью деньги за обучение и пр
Неужто в Гугл и Микрософт тахие лохи, что тратят зря деньги?
Все они - Яндекс и прочие компании - делают полезное дело.
Каждый доллар в вложенный в студентов, обучение обернется в большее число талантливых студентов, ученых в информатике, а значит новые знания, стартапы, новые идеи, лучшие сети, поиск, базы данных, оптическое распознование образов, итд итп Выиграет все общество, а значит и Яндекс, и Гугл, и Микрософт.
Аккуратный подход к проблеме платных ссылок (и отношений оптимизаторов с поисковой системой) демонстрирует следующая фраза: "Главная задача алгоритма — выявление непосредственно платных ссылок, а не сайтов, их продающих и покупающих".
Сами авторы оригинальной статьи писали этот комментарий на роем?
Себя не похвалишь ....
... Также Яндекс поддерживает школу анализа данных, организует лекции. Ашманов, все зря?
Нет, я не об этом спрашиваю. Я вообще у вас ничего не спрашиваю, мне у вас нечего узнавать, у меня своё мнение имеется.
Я говорю о том, что беспонтовые наезды на Яндекс в этом треде устроены так: Яндекс - лохи, потому что мало публикуются и даже на SIGIR их пустили со стендовым докладом постоят, типа носом не вышли ещё. Это детские разговоры, не по делу.
Я же говорю, что коммерческую компанию нужно оценивать по продукту, а не по количеству публикаций. Это если вообще вставать в позицию категорической оценки, которая здесь очень популярна: Яндекс лохи, Гугл рулит. Джобс рулит, МС империя зла и так далее.
Что касается улучшения внешнего мира и пользы публикаций для всех, это совершенно другая тема. Опять-таки, компания меняет мир к лучшему в первую очередь своим продуктом .
Это легко проверить от противного: если основной продукт дрянь, какое значение имеет количество публикаций?
Можно, конечно, рассматривать косвенное влияние, ну вот публикации, например. Тогда, если опять-таки хочется оценок, найти лохов и жлобов, нужно писать: компания Х - жлобская компания, она не рассказывает миру о своих изобретениях.
Заодно можно обсудить и благотворительную деятельность интернет-компаний.
Боюсь только, что тут тоже уже давно намазан толстый слой пиара, и мы опять начнём спорить с объектами пропаганды "инновационных компаний", "этичных компаний", "креативных компаний", борьбы за спасение китов от СО2, езду на электромобилях и приведение собак в офис, и так далее.
Игорь, ну что за паранойя тоталитарной секты?!. Это все равно, что Вас за мнение о посте про насилье над немками обвинять в нападках на Яндекс.
Эта секта - мой всегдашний конкурент.
Просто раздражает, когда говорят не по делу и мусолят мифы.
> Я не член этой секты. У меня своя.
А Наполеон у вас где лежит?
То, что яндекс успешная компания с хорошим продуктом никто не отрицает. Дело в том, что без серьезных исследовательских работ компания напоминает успешного бизнесмена ПэТэУшника. Это само по себе не плохо, но является предметом нападок любящего поглумиться сообщества умников со степенью. Еще приходит на ум сходство с оборотистым и малообразованным фермером, которого не принимает в городе никчемное светское общество. Короче, яндексу нужно где-то развести/купить себе диплом о высшем образовании и, наконец, почувствовать себя человеком :-D
Наполеон у меня в комоде лежит, рядом с шарлоткой.
Как можно выглядеть тупым, делая интеллектуальный продукт?
Слово "smart" очень подходит сегодняшнему Яндексу, так как в отличие от "clever" имеет ряд других значений, типа ловкий, смекалистый и пр. Сегодня, правда, понятия "умный" и "ловкий" сливаются в сознании пипла, но было время, когда один уважаемый мною профессор утверждал, что "хитрость - это от недостатка ума".
интеллектуальным является не продукт, а процесс производства
Продукт же должен быть простым
Это так же как в случае с кока-колой. Продукт простой, а производство сложное.
Или вон с моим мерседесом. Очень просто вводить, отлично слушается руля, мягкий и быстрый тормоз, продукт простой, а за этим сложное и интеллектуальное производство
В случае простого продукта, большинство пользователей понятия не имеют об интеллектуальности производства. Чем умнее производство, тем проще и не интеллектуальнее продукт. Вспомните какими были "интеллектуальными" поисковики лет назад, хотите найти рисунок - ищите так, навигациооный сайт - ищите по-другому, а сейчас поисковик сам все делает. Продукт "упростился", а производство усложнилось. Ню пользователи этого не видя
Делая "простой" с точки зрения продукт, вполне можно выглядеть тупым с точки зрения пользователей
Я недавно своему однокурснику, специалисту по написанию баз данных для коммерческих предприятий, у него куча сертификатов, САП Р-3 и прочее пытался рассказать как работают базы данных "внутри", индексы, распаралелливание, транзации. Он не мог поверить, что это сложно, и что в Оракле работает больше, чем 10 человек, "ведь это так все просто и быстро и тривиальное работает в моих приложениях"
К Антифишинг: про Бобби Фишера огромное количество информации, у него много интервью, возможно, вследствие большей "зубастости" американских журналистов. Хотя да, никакой "общественной нагрузки" в виде редактирования 64 ШО у него не было, это правда. Зато книги писал про тюрьмы в Штатах и выступал с заявлениями про несуществующий холокост - это может быть даже сложнее.
100 инженеров
Это ОЧЕНЬ полезно, это и технопиар и привлечение новых сотрудников и наш имидж, да и вообще повышает температуру в отрасли.
Конечно того что мы делаем недостаточно, нужно больше. И действительно есть, как пишет Игорь, объективные причины, почему это трудно делать в производственной компании.
Будем думать, как стимулировать людей писать больше.
Еще от Кирилла (автора статьи) комментарий к дискуссии
> Мы сразу подавали на постер, никто работу от главного потока не отклонял.
> Наоборот, нас на конференции спрашивали, почему мы не подали на доклад,
> ведь на основе данной работы можно сделать два хороших доклада.
> 1) У нас нет времени и возможности тратить дополнительные усилия на
> подготовку "полноценных" докладов/статей.
> 2) "Полноценный" доклад подразумевает гораздо более полное описание алгоритма,
> в чем мы не заинтересованы.
> 3) Для наших целей, вполне достаточно стендового доклада.
Прокомментирую еще конкретные реплики (не все, но те, что заметил)
> (анонимно) Мне какой-то яндексоид тоже помню говорил про "статью на СИГИР",
> а потом когда я проверил эта "статья" оказалось постером, там была какая-то
> совсем примитивная линейная модель для новостей
У нас никогда в жизни не было постера на SIGIR.
К сожалению не могу в силу анонимности автора этой реплики, утверждать уверенно, но этот Яндексоид похоже был я. Я когда говорю, делаю это довольно быстро. Иногда меня трудно понять. Я сначала говорил про то, что мы как-то раз неудачно подавали большую работу про Новости на SIGIR, а потом про то, что мы не часто пишем большие статьи, обходимся постерами, правда на конференции первого ранга (что, замечу специально для постероненавистников, по уровню и дальнейшей судьбе в видимости и цитируемости примерно соответствует статье на конференции второго-третьего ранга)
У анонимного слушателя эти два факта как-то склеились в голове. Ну а про то, что он "потом проверил", он здесь слегка сочинил, тем более что слышал он нечто близкое лично от меня, так что проверять как бы необязательно.
> (Ashmanov) в поисковой отрасли, в этом самом IR, никакой большой науки вообще нет
Игорь, по-моему, как раз тут и есть наука. :) Все бурлит, куча публикаций именно про поиск в лучших конференциях по Computer Science.
Ну, то есть, если в поиске нет науки, то вся информатика, сиречь computer science, тем более не наука.
> (анонимно) поисковый отдел в Микрософт сравним по размеру с поисковым отделом Яндекса
Я слышал, что побольше. Как вы измеряете?
> (itman) замена Интернет-математики на конкурс для программистов
Леонид, я тебе в твоем дневнике кажется уже отвечал, что мы намеренно пытались снизить планку для повышения массовости и вовлечению большего числа новых людей, как бы "ACM-щиков". Старый формат, как нам кажется, во-многом исчерпал себя.
http://portal.acm.org/citation.cfm?do...77.1135950
> Наоборот, нас на конференции спрашивали, почему мы не подали на доклад,
> ведь на основе данной работы можно сделать два хороших доклада.
Я отношусь с симпатией к авторам статьи, но с трудом могу представить, чтобы на какой-то конференции к подходили к стенду и спрашивали докладчиков "почему же вы не сделали полноценную статью". Формат стендового общения совсем другой. Могут попросить опубликовать код и разместить в сети данные, могут попросить опубликовать более полный доклад в arxive, но вряд ли будут спрашивать про "почему же не полноценный доклад"
> 3) Для наших целей, вполне достаточно стендового доклада.
Это какая-же цель? Сегалович приводит список целей
Это ОЧЕНЬ полезно, это и технопиар и привлечение новых сотрудников и наш имидж, да и вообще повышает температуру в отрасли.
Ни для одной из них стендового доклада недостаточно
Его достаточно только для одной цели
Сьездить на халяву за счет компании в Мадрид. Тогда " 3) Для наших целей, вполне достаточно стендового доклада. "
Именно для этого пишут стендовые доклады плохие студенты - прокатится на халяву, особенно если конференции на Гавайах или в прочих интересных местах.
Я слышал, что побольше. Как вы измеряете?
Размер никогда не узнаешь, но вроде сотрудники и той и другой компании говорят про сотню с чем-то
Новый формат хорош, но и старый был очень хорош. Они просто разные. У вас было опубликовано много хороших статей,поддержанных Яндексом. Жалко, что в этом году этого нет. А эти соревнования это совсем другой формат, расчитанный на совсем других людей.
Кстати, уже конец мая, довольны ли соревнованиями? Принес ли кто-то новые идеи или выигрыши за счет долговременной настройки параметров?
Ослепительный блеск вашей мудрости, в частности умение (одним пальцем левой ноги?) писать постеры для курортных поездки на Гавайи и статьи для более серьезных целей, заставляют меня думать, что если вы снизойдете до Яндекса, вы с легкостью сможете стать у нас директором по науке. Нам остро не хватает ни ваших умений, вообще, ни такого человека как Вы, в частности.
Без шуток, я прямо сейчас открываю для вас вакансию. Приходите, смиренно и трепетно ждем.
Ваша высокомерная уверенность в том, что всякий смертный мечтает работать в яндексе вряд ли работает на имидж компании. Вам есть с кого брать пример. :-D
Юра, мои поздравления!
Я не могу вспомнить, когда Илья отвечал на роемовские тексты
спасибо огромное, Ваше предложение - большая честь для меня.
Но я человек очень технический и мне интересно получать новые результаты и писать код, а не протирать штаны на заседаниях директоров и прочих балаболов. Пока я молодой, я буду совершенствовать себя технически, синекуры меня не интересуют.
По поводу лучей в темном царстве, спорить лениво, достаточно посмотреть, что Илья отвечает про Интернет-математику. Сегодня исчерпается Интернет-математика, завтра школа анализа данных. Люди, интересующиися IR и поиском, конечно же, имеются. Но они
а) почти не делают ничего мирового уровня
б) почти не поддерживаются на уровне текущей вузовской системы
в) компании Яндекс и Гугл в них чисто теоретически заинтересованы, но им больше нужны специалисты писать фултайм на Перле. Ну, такая у них тяжелая жизнь, они этим деньги зарабатывают.
Я здесь так аккуратненько ставлю почти, но рука очень порывается их зачеркнуть.
А чем занимаются московский и питерский офис гугла? Поиском или чем-то еще?
> когда говорю, делаю это довольно быстро. И
Не помню, может это были Вы. У меня плохая память на лица, по Вашему юзерпику не могу распознать.
А Вы не говорили, что сделали работу по оценке индекса аналогичную Бар Йосефу, но не успели ее опубликовать?
откуда такие данные?
А гениальная статья всегда пройдет, даже если английский не гладкий. Тем более я не могу понять Ваших проблем с английским. Месяц усилий это два-три дня усилий технического переводчика. Сколько стоят в России день-два технического переводчика? Долларов 500? Если переводчик не силен в теме статьи, нужен дополнительный день, чтобы заново пройти через статью и прилизать термины. Никаких "месяцев усилий" не нужно. Я с трудом могу себе представить, что такая огромная и денежная мегакорпорация как Яндекс не может себе позволить 500 долларов на переводчика, если она посылает на туже конференцию сотрудников без статей, которые на поездку и развлечения тратят гораздо большие деньги (Гунин и пр).
Заранее прошу прощения — этим материалом я владею ненамного лучше ашманова, болтающего про ВАЛ!!!:) публикаций “из какого-то Гугла”.
Тем не менее, штука прикольная, возможно, кого-то удручающая. Поэтому пересказ:
WWW задумывался как “отвечающая запросам индустрии, практически значимая” АЛЬТЕРНАТИВА SIGIR’у, “погрязшему в отвлеченном теоретизировании” (мотивация понятная и что-то в этой дискуссии напоминающая, не правда ли) Однако, со слов рассказчика, буквально за несколько лет “мы” (университетская публика) потеснили “их” (индустрию) и обжили пространство WWW. Или, как сказал бы лично мотивированный нелюбитель ученых, “загадили и WWW”. И сегодня WWW вполне брат SIGIR’у, хотя и не однояйцевый.
Я это к тому, что IR-ученые, они (мы) как кролики (а того хуже, как тараканы), Впрочем, у них (нас) все же немного другие поводы для гордости — не отсутствие, а наличие, например, работ (правда, я сам последние месяца три типа беспробудного enjoy life, впрочем, жизнь она разнообразна ;)
PS Надеюсь, этим постом я никого не обидел. Он про дрейф индустриальной альтернативы, не более.
> неклассические нетекстовые методы тогда не проходили на СИГИР за редким исключением
нет конечно. факторы тут СОВЕРШЕННО не при чем.
я понимаю что вы не читатель а писатель, но все-таки ПОЧИТАЙТЕ дискуссию на sigir-форуме и ответы Крофта прошлой осенью. Там были и возмущенные фанаты Брина и сторонники жесткой линии.
Крофт и СЕЙЧАС бы зарезал эту работу. Понимаете?!
Несмотря на коммерческий суперуспех и суперпиар в научной среде (которому поддаются даже такие независимо мыслящие ученые как вы).
Дело как в математическом формализме/академизме СИГИРа, так и, главное, в жестких требованиям к эвалюации и доказательной силе работы.
> а гениальная статья
А кто сказал что наши статьи была гениальные? Я?
Перечитал себя, не нашел.
Я сказал только что разработчики гениальные. А гениальные разработчики далеко не всегда пишут гениальные статьи. Гениальные статьи - это ваша прерогатива.
Вот Вам пример от моей жены... :-)
Есть такая женская книга имеющая двойное название. Одно звучит типа "Дневник Жюстин", другое что-то типа "этим утром я решила перестать есть". Вот две выдачи по запросу "Дневник Жюстин скачать":
1. http://yandex.ru/yandsearch?text=%D0%...par4=%2Fs3
2. http://www.google.ru/search?hl=ru&new...=&aq=f&oq=
В выдаче яндекса ни разу не встречается "этим утром я решила перестать есть". В выдаче гугла я насчитал 4-ре сниппета с "этим утром я решила перестать есть".
Где Вы найдете нужную Вам ссылку? Куда вы вернетесь еще раз за "некоммерческим" запросом?
Это конечно не статистика, но по-моему показательно. Что до статистики, то пики гугла в нерабочее время говорят сами за меня :-D
> Надеюсь со временем в WWW/SIGIR сообществе займутся тем же
Вам слово "TREC" ничего не говорит?
> А гениальная статья всегда пройдет, даже если английский не гладкий.
К сожалению, далеко не так. Когда принимаются 16% статей и 35% постеров (SIGIR 2009), рецензенты отвергают статьи с малейшими недостатками. А часто принимается на ура "скучное унылое говно" - красиво написанное, и с много греческих букофф. Кстати, такие статьи часто из MSR-A (для любителей индустрии).
Очень рад что Яндех побликует хоть постеры - конечно, хотелось бы увидеть детали (и более реалистичные результаты) в полновесной статье... например, в WSDM 2010?
Вы были в PC SIGIR? Откуда такие познания? Почему предпологаете, что Ваши собеседники тут знают меньше Вас?
Из Микрософт всегда были хорошие статьи, дайте пример "унылого говна", а также пояснения почему Вы эту статью занесли в "унылое говно". Интересуют, конечно, нормальные пояснения, а не "в курилке Яндекса так решили"
Да.
> Из Микрософт всегда были хорошие статьи
Есть MSR Redmond, MSR Cambridge и Live Labs. От туда - статьи нормальные и даже бывают гениальные. А есть еше MSRA (MSR Asia) - они посылают по 30 статей на каждый SIGIR, WWW, итд, и качество соответствует (иногда случайно несколько и принимают).
> дайте пример "унылого говна", а также пояснения почему Вы эту статью...
Я в сортах говна не разбираюсь :-) © -- да и в принципе все не так плохо (itman так сказал, я цитировал) , но вот примеры (SIGIR 2008), вообше ни одной новой идеи:
- Exploring Traversal Strategy for Web Forum Crawling Y. Wang, J. M. Yang, W. Lai, R. Cai, L. Zhang and W. Y. Ma (Chinese Academy of Science/Microsft Research Asia)
- Finding Question-Answer Pairs from Online Forums
G. Cong, L. Wang, C.Y. Lin, Y.I. Song and Y. Sun (Aalborg University/Tianjin University/Microsoft Research Asia/Korea University)
...
п.с. Я совсем не в Яндексе, было бы интересно узнать что там у них, в курилке.
Это конференция еще не стоит на уровне СИГИР
В WWW есть несколько неплохих траков, в которых принимают хорошие статьи (например, текст майнинг, например, все что связано с интернет ads), есть несколько плохих траков, где принимают все подряд ("семантик веб").
Почетно попасть в один трак, другой трак никаких плюсов вашей работе и вашему СВ не дает
Не можете назват ваше имя-фамилию? Русскоязычных там совсем мало.
А в чем проявляется гениальность разработчиков? Если нет гениальный статей, можете мне указать гениальные разработки?
А о чем говорят пики Гугла в нерабочее время?
Это Вы?
Просто здесь темно.
Пики Гугла в нерабочее время могут говорить о многом пытливому уму:
- 30 000 энергичных сотрудников Гугла так наяривают поиск для написания гениальных статей, закупки items на Ибей и рассылки резюме, что обычным пользователям поработать с Гуглом удается только в нерабочие часы.
- Работающие люди не пользуются подобной ****** . А вот бездельники завсегда.
- Никаких пиков нет, а есть смещение доли. То есть смещение лобной доли у того, кто это написал про пики.
Смещение и пик суть синонимы, ну, для нас с вами, для математиков.
Другому парню или тому же ****************, не в курсе, прошу простить если чего не так
Пики гугла в нерабочее время говорят о большей популярности гугла в нерабочее время, как я полагаю. :-) Если предположить, что дизайн, юзабилити и поисковый алгоритм гугла не зависят от времени суток и дня недели, то можно набрести на мысль о влиянии выдачи на популярность ресурса. Кроме того, если отмести увеселительную часть про ****** от интернета и их гениальных ненавистиков, предметом этого обсуждения является публикация об улучшении некоммерческой выдачи яндекса, которая, почти наверняка, заботит этих замечательных ребят не просто так.
ЗЫ Я здесь недавно, но мне здесь определенно нравится. Главному почет и уважение.
Да это не бог весть какая проблема, в принципе. Все равно в циферках полноты, точности и прочих F1-мер для читателей/слушателей особого смысла нет. Интересны алгоритмы и разные другие прикольные идеи. А измерять эффективность в любом случае придется самому, на своих данных, под свои задачи и своими методами (и результаты в любом случае не совпадут с теми, что названы в статье).
Илья - начальник очень сильный
ведет компанию вперед
с его могучим руководством
растет наш деньгооборот!
Следует ли признать гениальным Филипа Киркорова? Ведь популярен?! А Аллу Пугачеву?
Вот если бы компания из 10 разработчиков сделала независимо русскояызчный поиск сравнимый по качеству с Яндекс и Гуглом, я бы их признал гениальными. А то, что разработчики решают какие-то маленькие задачки уровня курсовой работы западного университета местного назначения никак их гениальными не делают. Следует ли признать тогда все студентов гениальными?
Сами алгоритмы малоинтересны. Andrew Gelman как-то на лекции предложил классификацию статей (=задач) по степени сложности и интересности.
Там было по-моему то ли четыре, то ли пять уровней
Крайние
5
Взять крайне сложную нерешеную проблему, к которой сводятся многие другие нерешенные проблемы, и найти новое решение к ней
1 Взять маленькую частную задачуприменить к ней парочек стандартных методов machine learning или ir или чего-то еще и посмотреть что получится
Само по себе упоминание "математического алгоритма" не делает статью интересной. Просто набор формул делает статью солидной разве, что для какой-нибудь RCDL. Интересность статьи определяется фундаментельностью и нерешеностью проблемы, а также сводимостью к ней других проблем.
1. Рад, что RCDL становится именем нарицательным.
2. Мерси за идеальный корпора-стих, чрезвычайно понравился.
Непременно попрошу почти полностью собравшуюся в Москве группу из типа шестидесяти двух соавторов "алгоритма шестидесяти четырех русских" (а может, четырех, все время путаюсь) хором и с чувством исполнить на осеннем чествовании шестьдесят третьего соавтора.
А ну вот и стандартный мем: "да я ваш Яндекс на третьем курсе в курсовой за два месяца написал".
Использование этого мема с головой выдаёт его распространителя.
Знаете, я за последние три года встречался с гуглоидами раз десять-пятнадцать. Они сюда активно ездили по поводу открытия офиса. В том числе с вице-президентами по разработке, по ЕМЕА, по маркетингу и так далее.
Все задавали главный вопрос: "почему Гугл в России не первый?". Я даже как-то по просьбе Долгова прочёл 20 странствующим по локальным офисам маркетоидам Гугла лекцию ровно под этим названием.
С этого же вопроса начал и Брин в 2003, когда мы сидели с ним в ресторане.
Вероятно, в Гугле не могут решить эту задачку для третьего курса? А в Яндексе как-то левой ногой всё-таки решают эту простенькую задачку. Так-то конечно, задачи поиска по Рунету - это простейшие задачи, для студентов.
Я предлагаю талантливым студентам из Лондона всё-таки изучить наш тест качества поисковиков http://analyzethis.ru, чтобы задуматься, сколько там задач, каких именно, и почему Яндекс первый по 80% анализаторов, включая полноту.
Замечу, что наши разговоры с гуглерами в 2005-2007 пришлись на тот период, когда Яндекс был заметно хуже Гугла именно по качеству поиска в Рунете. С тех пор Яндекс совершил значительный скачок , стал первым по качеству, стабилизировал и начал увеличивать свою долю поискового рынка. Это, очевидно, борьба двух недоумков, умственно отсталых, которым мог бы помочь любой талантливый студент за пару месяцев.
P.S. На прямой (в оригинале риторический) вопрос студентов про гениальность Аллы Пугачёвой отвечу - да, это с очевидностью гениальная эстрадная певица. А Киркоров, вероятно, нет.
Думаю, вы не пытались пока всерьёз обдумать эту историю. Вам неспроста написали вверху про смещение доли. Это не пик популярности, а сдвиг процентной доли Гугла относительно Яндекса. Это Яндексом больше пользуются на работе. Это может показывать следующее:
а) пользователи Гугла в России - гики, у которых много интернет-активности - дома. А у Яндекса массовый пользователь, которому хватает интернет-активности на работе.
б) вообще русская аудитория имеет больше компьютеров на работе, чем в офисе.
Про соотношение коммерческой/некоммерческой выдачи это вообще не говорит ничего.
Я лично склоняюсь к а). Из этого предположения, кстати, следует, что и подсчёт доли Гугла может быть завышен, потому что считаются переходы, а не пользователи. А гик Гугла, по идее, должен производить в среднем больше поисков на рыло, чем массовый пользователь Яндекса.
Вот в России Яндекс популярнее гугла, а в(на?) Украине гугл популярнее Яндекса (намеренно, сравниваю только русскозычный поиск). Причем в процентах выигрыш Гугла на Украины выше выигрыша Яндекса на России. Значит ли это, что в одном отношении Гугл гениальнее Яндекса, а в другом Яндекс гениальнее Гугла? В каком отношении? Вроде бы качество поиска и для того и для другого региона должно быть более менее одинаковым, судя по ашмановским метрикам, качественные результаты должны быть одинакова, почти теже информационный и навигационные сайты, а аудитории абсолютно разные. Кто гениальнее?
И еще. Был ли Наполеон до Ватерлоо гениальным полководцем, а после Ватерлоо он перестал быть гениальным полководцем?
В феврале доля Яндекса росла, а в апреле и мае падала
http://www.liveinternet.ru/stat/ru/se...riod=month
Значит ли это, что в феврале в Яндексе работали более гениальные программисты, чем в Гугле, а в апреле и мае в Гугле программисты стали более гениальными?
Я говорил о том, что дурацкие заявления в стиле "это уровень студенческой работы" не имеют отношения к реальности. Задачи очень сложные, чуть-чуть расслабился и снизил темп - потерпел неудачу. Яндекс проиграл Украину, это неудача. Но и местные игроки ещё сильнее проиграли, они-то могли бы быть первыми, они свой Уанет знают лучше всех.
Заметим, что по миру в подавляющем большинстве локальные игроки проиграли Гуглу. Это значит, что Гугл изначально задал высокую планку, а русские, чехи, корейцы, китайцы и кое-кто ещё её преодолели.
До Ватерлоо он был национальным лидером, а после перестал им быть. Так понятнее в смысле поисковиков?
Ну и вообще вроде бы это общее место, что он был гениальным тактиком, а стратег он был паршивый, поэтому сражения он выигрывал, а войны он проигрывал.
И это, похоже, у них работает.
Есть ещё одна проблема, что гении в смысле ума далеко не всегда успешны и даже не всегда результативны.
Поэтому нужно брать ещё одно слагаемое - результат.
Скажем, в Апорте разработчики придумали и сделали многие инновации значительно раньше Яндекса и Гугла. И где тот Апорт?
Дружище, я знаком с Вашей версией "а" причины большей гениальности гугла в нерабочее время. Мне она кажется неубедительной вот почему: Согласно Вашей версии в выходные мы должны наблюдать общее по рунету увеличение отношения просмотров к посетителям, а этого согласно статистике лайвинтернет не происходит. В пользу же моей гениальной версии говорит тот факт, что на коммерческих ресурсах вышеупомянутое отношение в нерабочее время падает, а на развлекательных растет. Таким образом, гениально было бы отнести яндекс к коммерческим ресурсам, а гугл к развлекательным, так как это уже сделали рекламодатели. Думаю, что мужчины и женщины, использующие адвордз и директ в целях личного обогащения, засвидетельствуют Вам, что на коммерческих сайтах рентабельнее директ, а на развлекательных гугл адвордз.
ЗЫ В дискуссии о гениальности разработчиков яндекса я на Вашей стороне, не поймите превратно.
А вот я не знаю этой истории. Ладно, Апорт не стал лидером рынка, а как он повлиял на развитие поиска в России? Какие идеи Аппорта были адаптированы другими системами?
А вы не собираетесь написать историю российского поиска?
Я читал Вашу "жизнь в пузыре" - Вы очень талантливо и интересно пишете. Было бы интересно почитать техническую историю поиска, какие идеи кем были придуманы, какие идеи кем были адаптированы, какие идеи остались, какие умерли.
Вот, конференции на которых публикуются большие поисковики вроде Yahoo! и Google, так как поиск неизбежно порождает решение проблем в этих областях
VLDB/SIGMOD/ICDE -- управление большими объемами данных - индексы, логи, онлайновый анализ огромных объемов данных. даже многие web темы начались там, например, работа важная работа Diligenti по machine learning для тематического индекса была опубликована в VLDB 2001. Deep web публикуется на таких конференциях, см недавние работы да и cloud computing
конференции по Natural Language Processing, Computational Linguistics
ICML и прочие конференции по machine learning -- распознование образов, речи, фундаментельны проблемы machine learning
конференции по security и privacy
+1. А если бы не только российского, то совсем хорошо. Может, исторические труды в области IR уже существуют, кто знает?
> Рад, что RCDL становится именем нарицательным.
А чему тут радоваться?
Да и хотя RCDL - это далеко не SIGIR, но и здесь попадаются полезные статьи, в том числе из "Яндекса".
> Взять крайне сложную нерешеную проблему, к которой сводятся многие другие нерешенные проблемы, и найти новое решение к ней.
Это самое интересное, спору нет, но ведь решение все равно будет алгоритмическим. Так что вот этого заявления я не понимаю:
> Сами алгоритмы малоинтересны.
"пусть даже", "пусть даже", "пусть даже"
Чтобы значили эти два простых русских слова? Как их можно было бы интерпретировать?
Еще немного и я сойду с ума.
(бормочет про себя "пусть даже", "пусть даже", "пусть даже", уходит, вздрагивая и нервно оборачиваясь)
А Вы тоже гениальный разработчик? Или Вы гениальный геофизик?
Джон Баттеле написал неплохую книгу.
--------------------------------------------------------
Почему именно "гики"? Может, это люди тех профессий, у которых на работе интернета просто нет и не может быть.
Спортсмены, врачи, технологи, учителя. Да даже офисные служащие часто не пользуются интернетом (ибо данные по работе есть во внутренней документации). Или сотрудницы в операционном отделе банков - ни разу не видел интернета, сидят в банк-клиенте и не ходят ни по каким сайтам. Кстати, у многих строгий контроль: может и хотели бы, но нельзя (ибо не нужно, не зачем время тратить рабочее).
Или рабочих и работниц сборочных заводов калининградской области тоже к гикам отнесем?
>А чему тут радоваться?
Тому, что это сильно упрощает ориентацию -- "молодых неиспорченных" (а равно и "испорченных" :)
SIGIR/WWW в России еще более нарицательное имя (что огорчает, все же это не более чем конференции, пусть и хорошие, но не небеса обетованные)
С нарицательными как-то все сразу понятно: вам на - условно говоря - SIGIR/WWW, а вам -- на RCDL :))
Статус реальной (не нарицательной) штуковины полностью определяется именами организаторов. Иногда имена одиозны, иногда невзрачны, а иногда -- напротив
Скажем, если разделить пользователей рунета на какие-то категории -- профессионалы (врачи, программисты, юристы, ученые), служащий персонал (клерки всех видов, секретари), рабочие, итд
Сколько пользователй в каждой категории?
Как использует интернет каждая категория? Сколько скажем информационных запросов за месяц? Сколько интернет покупок за месяц? Сколько запросов "поиск товара" за месяц? Сколько развлекательных запросов за месяц? Ищут информацию по каждой категории запросов преимущественно с работы или из дома
Yandex vs Google vs Seatch.Mail.ru vs Rambler
в зависимости от уровня образования (среднее, высшее, кандидатская степень и выше) и дохода
А почему не сделать ассоциированный workshop или даже сессию по поиску в восточной европе? есть же секция по китайскому поиску. Все эти проблемы "платные ссылки" никому интересны за пределами рунета, а в пределах специализированной секции или воркшопа можно было найти заинтересованых участников для дискуссии
Ну, как известно, Москва находится в России, Россия в Евразии, Евразия -- на Земле, а Земля -- это просто такая часть Китая. :)
> в восточной европе....
я - свое, совершенно личное, ничего не определяющее мнение.
-- "в восточной европе" -- категорически против!!! (я не помню названия DB-конференции - восточноевропейской сестры RCDL с тем же заведующим ** и тем же научным статусом, но сегодня нет никакой "восточно-европейской науки" ).
-- для "славянских языков" -- да и еще раз да! Темы тут все, включая, например, очень популярный patent IR
--------------
** ('это сноска) для знакомых с подводными перепетиями советской околонаучной DB-жизни поясню, что это не позиция одной из сторон в сношениях Калиниченко( и ко.) и Арлазарова (и ко.) Обе стороны одинаково милы мне. И обе вызывают в памяти афоризм юности: "возиться[там другое слово:) с крысами" ;)))
Ето шутка, да? Ети проблемы очень даже интересны (см. AIRWeb, те же SIGIR/WWW/CIKM/VLDB/KDD).
> А почему не сделать ассоциированный workshop ... по поиску в восточной европе?
Если кто-то из Яндекса (условно - то есть, из тех кто с Рунетом работает) готовы организовать такой Workshop, я думаю SIGIR очень серьёзно рассмотрит заявку.
п.с. SIGIR 2010 в Европе: http://www.sigir2010.org/doku.php?id=home
с собственными языками (богатая инфлексия итд) и кучей других проблем специфичных для этого региона
я думаю вполне заслуживает отдельной сессии
Много больших независимых поисковиков - Rambler, Яндекса, seznam
Узнал по стилю письма
Видно остался у меня еще "стилистический глаз"
да я не конспирировался особо.
п.с. сорри за ощибки, транслит глючит
> Если кто-то из Яндекса (условно - то есть, из тех кто с Рунетом работает) готовы организовать такой Workshop, я думаю SIGIR очень серьёзно рассмотрит заявку.
А зачем? Есть два самодостаточных экономически мира, практически не нуждающихся друг в друге.
На фига нам SIGIR? Будет здесь больше денег чем там - сами прибегут кучами, не будет - так всякие временные акции будут иметь весьма жалкий вид.
Большинство российских игроков и так уже объединены в рамках РОМИП, задачи которого даже ближе к жизни, чем задачи TREC или CLEF.
Русский язык Запад практически не интересует (воевать пока не собираемся, тайны чиновники сами выбалтывают, на рынок их сюда не пускают).
Основных российских игроков пока не интересует английский, испанский или китайский.
Все-таки в основе каждого опубликованного исследования лежит некий шкурный интерес - прорекламировать себя, прежде всего.
Как тут уже откровенно прозвучало - западные люди (кроме небольшого числа несомненно достойных фулл-профессоров, которые в университетах могут делать что хотят, а могут и ничего не делать), прежде всего озабочены тем, чтобы набрать очков для CV. А набрать очков для CV - чтобы устроиться на работу в корпорацию и прекратить, наконец, писать статейки с безумным требуемым уровнем evaluation, выполняемым причем на сомнительных, но открытых коллекциях.
У нас же все участники уже в корпорациях (иначе не выжить), где работают с реальными данными своих фирм или данными клиентов. Устроиться в разработку яндекса, рамблера, российских гугла или майкрософта не является проблемой для студентов основных вузов.
Выполнение evaluation на чужих данных полезно для исправления ошибок в своих подходах, но мало что дает для доказательства правильности. evaluation в западном стиле имеет чисто диссертационный интерес, что в настоящее время не является приоритетным для "российских" ученых - диссер можно защищать и проще.
Более важно умение решать реальные задачи, история выполненных проектов.
Конечно, в статьи на SIGIR обычно вложено много труда (в хорошую типа человеко-года), по коэффициент полезных из них не такой уж и большой, а уж применить на практике можно просто единицы (обширный, но игрушечный evaluation плодит часто концептуально неточные выводы).
Например, посмотрите сколько умных статей опубликовано по классификации текстов. А потом посмотрите как работает Рейтерс или Lexis-Nexis, а также материалы OTC-1, OTC-2.
Поэтому, пока нет реального поискового рынка, в РФ хватает РОМИПа, как тусовки, и чтения статей SIGIR как повода для "поговорить". А просто "отапливать" Запад - писать на SIGIR за свой счет без надежды получить компенсацию - получается довольно бессмысленным занятием.
Если будет найден механизм компенсации, пусть бы как у китайцев - по $3000 за публикацию на Западе (это мало, но хоть что-то), тогда будет другая жизнь.
Кстати насчет Восточной Европы.
Что за снобизм? Посмотрите на чешский TSD или польские конференции - уже почти SIGIR.
Если вернуться к началу разговора.
Зачем Яндекс опубликовал статью с информацией о РЕАЛЬНОЙ проблеме - не очень понятно, можно объяснить только тем, что борьба с накрутками является общественно полезным делом...
Почему не принимали у них статью с новостями - тем более непонятно с человеческой точки зрения - новый метод, который технологически очень элегантен. Но понятно, почему по SIGIRовским меркам - не mainstream, нет ссылок на игрушечные работы.
Любителям сослаться на Гугл можно только сказать, что если Гугл что-то опубликовал, то это в Гугле либо уже не используется, либо никогда не использовалось. У них жесткая цензура
Например, посмотрите сколько умных статей опубликовано по классификации текстов. А потом посмотрите как работает Рейтерс или Lexis-Nexis, а также материалы OTC-1, OTC-2.
Это не очень большой секрет, что за исключением нескольких экзотических областей академическое сообщество (SIGIR, WWW) отстает от индустрии от 3 до 5 лет. Это относится не только к университетам, но и research департаментам многих компаний, которые держатся отдельно от инженерных департментов и работают на конференции, а не на продукт.
http://www.phdcomics.com/comics.php?f=1178
В России, Чехии Польше есть (было) несколько очень сильных лингвистических школ, но они не смыкаются с поисковиками.
В индустрии они более близки к распознавованию речи. Интересно, будет ли Яндекс делать какой-то проект по поиску в аудио и видео файлах наподобие гугловского поиска по речам президентских кандидатов на ютубе
А кто лучшие яндексовские олимпиадники?
Петю Митричева в Яндекс уже взяли? А bladerunner?
Четвертое место на районной олимпиаде по ботанике в пятом классе.
Да, с классификацией особый прикол - ученые исследуют разные умные методы машинного обучения, а реальные коммерческие системы основаны преимущественно на ручном труде и тупом (с точки зрения ученых) выделении и описании ключевых терминов. Сказанное относится не ко 100 % ученых и коммерческих систем, но общая тенденция такова, и с момента проведения OTC она не изменилась.
А про элегантное решение в статье 2006 года понравилось, спасибо, расмешили.
возможно не все поняли, что речь идет не о статье Яндекса на WWW2006 про определение новостных запросов - достаточно простую
а упомянутую Сегаловичем не принятую статью о кластеризации новостей, которая, кажется, так в результате нигде и не опубликована, кроме записей в блогах
они кластеризуют новости путем исполнения специального типа запросов - это, с моей точки зрения, не самый идеальный способ с точки зрения полноты, точности и т.п.
но технологически этот способ элегантен, так как позволяет им использовать стандартный engine, включая стандартное распараллеливание при выполнении запроса, что весьма и весьма полезно для оперативной кластеризации потока новостей
кроме того, сам способ кажется мне новым (по крайней мере на 2006 год)
Найти статью Сегаловича про алгоритм кластеризации новостей, которая написана примерно в начале 200х.
Вполне закономерная уверенность для человека, отдавшего много (15?) лет своей жизни какой-то компании.
А умные.... сейчас активно нанимают на работу Facebook и twitter.
Если ты умный, молодой и хочешь сделать что-то большое и заметное, то тебя привлечет возможность сделать рекламу в социальных сетях (пока никто не умеет этого делать), поиск и аггрегацию микроблогов (7 поисковиков по твиттеру, ничего нового и революционного нет, а потребность есть), а не разбираться в провинциальном поисковике в каких случаях "Сочи" должно склоняться в "сочиться", а "какой" в "какать"
Ах если бы, ах если бы. Не жизнь была-б, а песня бы.
Берём, и ещё как.
Ага, ага. Есть еще провинциальный Байду, да.
- Скажите, а вот эти брюки, они где пошиты?
- Это джинсы, они из Америки.
- А это далеко от Жмеринки?
- 5000 верст.
- Скажите пожалуйста, какая глушь, а как неплохо шьют!
Что ж так Гугл и Микрософт стараются в рунет влезть и все никак не могут?
Где то Фейсбук, что-то его тут не видно? Майспейс где?
И вообще, они откуда? Из США, этой депрессивной страны, с самым большим национальным долгом, наполненной человеческими отбросами из всех стран мира, с самым тупым и жирным населением, самой агрессивной на свете, являющейся административным регионом Кении? Фу.
Да это было про сочинский поисковик Захарова небось. Какать и сочиться все равно придется.
Вроде бы у Фейсбука несколько сотен миллионов пользователей. Что на порядок превышает общее число пользователей Рунета. Предпологаю, что сейчас они каждые 2-3 месяца прирастают дополнительным "рунетом" не влезая в рунет.
Господи, какое умственное убожество и иллюзорная картина мира!
Вы бы хоть Алексу почитали, что ли, если до остальных метрик ума не хватает дотянуться.
В мире всего примерно 1 (прописью один) миллиард пользователей Интернета, включая Китай .
А то и меньше, по некоторым данным.
Значит, у Фейсбука каждый месяц 25 миллионов новых пользователей? За год - триста миллионов?
Мальчик! Тебе сто тысяч миллиардов раз говорили - не преувеличивай!!!
П.С. И пиши "предполагаю", пожалуйста.
http://blog.facebook.com/blog.php?post=72353897130
Апрель 2008 года - 100 млн
http://blog.facebook.com/blog.php?post=28111272130
Итого 100 млн за год, или 25 млн (рунет) каждые три месяца.
В Контакте 30 млн пользователей. Рунет меньше, чем ВКонтакте?
Из моего села почти все одноклассники есть в "одноклассниках", но многие на сообщения и письма отвечают примерно раз в месяц, так часто они выходят в "интернеты".
Илья, мне всегда было интересно, почему яндекс ограничивается рунетом? Почему бы вам не попытаться замутить, может и на деньги государства, экспортный проект? Даже если чего не получится, вы получите капусту, чиновники откаты и пиар, наш пипл, возможность в перспективе гордиться своей страной чем-то еще кроме Гагарина, а пипл стран импортеров возможность не пользоваться американскими поисковиками... Ну, и в любом случае - это более перспективно, чем пытаться продавать жигули в Германии, а ведь они там продаются.
давайте зубы!
Мин науки сейчас собирается вычеркнуть в целом информационные технологии из перечня критичных технологий, что автоматом сократит в разы финансирование.
Я грю, пусь идут к Путину. Пусь позвонят ему на мобильник. Объяснят ему как он выгодно будет смотреться в телевизоре перерезающий ленточку перед новым мегаофисом нашего IT-флагмана, потрясая кулаками в сторону американских партнеров! Кароче, пусь делают чего-нибудь, не всем же здесь сидеть, лясы точить.
на ниву ушли все сбережения последних 8 лет ;( разводить не будем
а вот про аппетит ошибаешься. он-то как раз разыгрывается ;)
как наблюдатель откатообразующего возлегосударственного програзма говорю
Потребуйте больше. Объясните, что Гугл дороже Газпрома в разы.
> Не умеем мы это, никогда не умели, и уметь начинать не хочется.
Найдите того, кто хочет и умеет, иначе рано или поздно придется заканчивать. Заклюют...
+ 100
Но кроме гика и любителя технологий есть еще и и Волож, а Волож это "золотая акция сбербанку".
Кто сделает поиск (а поиск ли нужен) по микроблогам заработает милиларды.
Все что делают сейчас - поиск по дате и с "релевантностью" по записям, поиск по ссылкам с записей, облако тагов -- это все маленькие добавки и давно известные технологии, которых будет недостаточно. Нужно что-то принципиально новое.
Чтобы сделать поиск по микроблогам сейчас, не нужно огромных датацентров и кода в десятки миллионов строк. Нужно что-то принципиально новое. Брин с Пейджем тоже начинали с парочки компьютеров, небольшого кода и одной идеи.
что с ней делать?
если вы будете искать "обама" на твиттере
то получите милилоны записей, которые вам не интересны
"релевантность" совсем не связана с "интересностью пользователю" (которая может быть вовсе не функций одного поста, а функцией множества постов или их "аггрегации")
короче, никто не знает что делать
есть золотая росыпь, а как рыть?
всяко лучше, чем "Сочи"-Сочиться Какать-какую
Совсем ебанулись наши ИТ-эмигранты.
То в Фейсбуке 30 миллионов пользователей в месяц прибавляется и СОТНИ миллионов всего.
То Гугль дороже Газпрома.
Ну вы сходите, низкопоклонники перед западом, на какой-нибуль ГугльФинанс, посмотрите уже.
Газпром не так давно был второй-третьей компанией мира по капитализации. Гугль и близко не валялся.
Галактека опасносте, гугл догоняет!
Впрочем, капитализация сбербанка на прошлой неделе была больше чем у сити, поэтому что отражает данная невидимая рука рынка - большой вопрос.
Но невидимая рука рынка доставляет, да.
Буа-га-га. Чую я, Вы еще не сняли георгиевскую ленточку с антенны своего фокуса...
Изначально было сказано
Предполагаю, что сейчас они каждые 2-3 месяца прирастают дополнительным "рунетом" не влезая в рунет.
так и оказалось
Рунет - 25 млн пользователей (Яндекс 60 процентов рунета, беря статистику яндекс с их статистического сайта)
фейсбук прирастает 100 млн пользователей в гож
итого получаем каждый три месяца на фейсбук приходит по рунету
(надо учитывать что рост фейсбука растет, а рост рунета замедлился, по мнению статистики ЛИ, которая дает завышенные данные в марте было 43.4 млн пользователей, в апреле 43.8млн в мае 41.7, то есть сезонные месячные колебания уже преаышают любой рост и роста рунета больше не наблюдается)
Когда Вы сравниваете две компании в долгосрочной перспетиве, относительные изменения важнее абсолютных цифр
http://moneycentral.msn.com/investor/...okie=1&SZ=
А зачем это надо учитывать? Что вообще сравнивается и зачем?
Что следует из того, что в Фейсбуке много пользователей, а в Рунете в целом как бы меньше?
У меня ощущение, что вы просто хотите сказать, что там всё круто, а в говнорашке как всегда - нет.
Ну это мы уже много раз слышали.
Рунет всегда составлял 1-2% от мирового Интернета по пользователям, контенту, трафику - и какой смысл его сравнивать с глобальными проектами?
Тем более, что скоро все глобальные проекты будут покрываться локальными проектами Китая, как овца быком.
Достаточно на Ку-Ку посмотреть.
Ну и вообще сравниваете вы разные вещи, яблоки с апельсинами: регистрации Фейсбука (где процентов 3040% точно мертвяки) и реальных, живых пользователей.
А если сложить "пользователей" Яндекса, Одноклассников и ВКонтакте, их окажется 100 миллионов - и что?
Это регистрации, заходы, показы, а не пользователи.
А в Майспейсе, Гугле, Хомейле, Фейсбуке в сумме миллиард получится - и что?
В общем, мысль-то какая? Только содержательно, а не "провинциальный поисковик", "в Фейсбуке десять Рунетов" и так далее.
Я, конечно, могу поверить, что по каким-то прихотям судьбы гениальный программист пишет окошки в 1С бухгалтерии, гениальный поэт ограничивается статьями в заводскую малотиражку, гениальный композитор за всю жизнь не написал ничего кроме небольшого этюда для детского садика ("не раскрылся"), гениальный математик ограничивается решениями задач из демидовича, мне просто непонятно зачем гениальными разработчикам терять свой талант на "какать-какую", а не решать большие и сложные задачи уровня фейсбука или твиттера.
говорится о честолюбии ученого или разработчика-изобретателя, желании отвечать на сложнык вызовы и решать сложные проблемы, а не об "экономической целесообразности" "и в России можно заработать на домик и машинку".
Ну, нравится вам идея делать что-то глобальное - так делайте (какие, кстати, на данный момент ваши глобальные достижения?) Но зачем других-то стараться опустить?
Русский поисковик не может нормально работать, если он проблемы типа "какая" не решает. Гуглу тоже, кстати, пришлось как-то проблему машинной морфологии решать, хотя они годами рассказывали, что это не нужно.
Как, по-вашему, проверка правописания в Ворде нужна или нет? А если нужно, то кто её должен делать? Там приходится решать все эти проблемы, а глобальный игрок их решить не может, как правило.
Насчёт ваших "вызовы" - ну вот Антивирус Касперского решает именно глобальную задачу, является 3-4 в мире по обороту, 1-3 по качеству (как считать). Finerader - где второй, а где и первый на локальных рынках, твёрдо второй в мире. Что не устраивает? Parallels - бесспорный номер 1 в своей сфере.
Гениальные там разработчики? Да какая разница, мы же про продукт говорим.
Как вообще связана "гениальность" разработчика с его локальностью, не понимаю.
Достоевский писал на русском и для русских. Пушкин - гениальный русский поэт, бесспорный номер 1 в нашем мире, совершенно неизвестный на Западе, потому что его невозможно перевести адекватно, все переводы превращают его в салонного французского поэта средней руки.
И что? Он не гениален теперь?
если вы на том же msn.com возьмете другой период, 10 лет, а не 5, то увидите, что гугл - лишь плесень на трубах газпрома:
http://moneycentral.msn.com/investor/...CP=0&PT=10
Что, впрочем, не мешало в некий момент GM-у стоить меньше, чем складские остатки автоваза. Надо было менять....
1 по качеству, в числе лидеров по обороту
на рынке с огромной конкуренцией, среди конкурентов компании с огромным капиталом, огромными человеческими ресурсами.
Finereader Parallels - тоже продукты гениальных разработчиков, тут я с Вами на все сто
Достоевский очень популярен на Западе, не менее, чем Шиллер (пример, "иностранного" для англоязычных стран). Он есть почти в любой серьезной университетской литературной программе, и даже в продвинутых школьных. Книги достоевского (ПиН) входят во все списки 10 наиболее значимых книг 19 столетия
Число продаж на Амазоне для Преступления и Наказания
Amazon.com Sales Rank: #1,229 in Books
http://www.amazon.com/Crime-Punishmen...122&sr=8-2
1229ое место это очень много, это Амазон.
Пушкин менее читаем, как и все поэты, но не менее известен. В любом курсе вы найдете по меньшей миру критику его основных произведений (как можно изучать Достоевского не изучая Пушкина? )
Глинка и Мусоргский писали русскую музыку, но они оказывали влияние на мировую культуры. Им было бы не интересно ограничиться залами Петербурга и Москвы.
Вообщем, локальных гениев не бывает.
parallels одно время был "первым на маках" (ибо ничего другого не было), возможно там первым и остается, но "глобальный лидер" - VMWare. Что не мешает тамошним (VMWare) разработчикам рассказывать про эту компанию *всякое*.
Вообще, мне удивительно, что размер рынка/компании считается тут коррелированным с "возможностями для гениального разработчика". Отвлекаясь от убыточных интернет-стартапов (и неубыточного гугла - тоже), Adobe-Microsoft-Oracle-Symantec-SAP - это что, место где хочется гениально работать? Да вы охренели.
Вы сравниваете рост газпрома по отношению к газпрому 1998 года и рост гугла по отношению к гуглу 2004 года.
Если вы хотите справедливой оценки, вам надо найти оценки гугла на 1998-2004 год и перестроить график по отношению к ним.
Сколько стоил Гугл в 1998 году? 10000 долларов? 50000?
Если вы перестроите график, то Газпром будет небольшая загогулина
Не размер рынка важен, а возможность решать большие глобальные задачи, которые влияют на большую область индустрии (и решают проблемы огромного числа юзеров)
Гениальность абби не в том, что они завоевали рынок (это следствие), а в том, что умеют решать задачи, которые хотят решать все (распознование текстов на многих языков, перевод), так как никто решать не умеет. Если бы они решали задачи распознование текстов на фарси и только, то вряд ли бы их кто-то зачислил в гениальные
Если гугл брать с 98-го года, то надо и газпром брать с момента появления решения "а не заслать ли на Ямал геофизиков...."
Становиться ведущим инженером по кручению гайки №6 ключом на 18?
"Да вы ох..ли" (как говорили избиратели Монголии про гусиную х...ню)
Ну вот Adobe и их флагманский продукт - Фотошоп. Миллионы пользователей, продукт действительно флагманский. Много ли глобальных задач там решено за последние 4 версии (~10 лет)? И можно ли их вообще там решать, если все устоялось и пользователи ругаются даже от смены хоткеев?
Будет ли он их решать в FB/Google/MS/Adobe/Oracle , создаст свой собственный стартап или будет решать там где он работает, это личное дело разработчика. Но было бы странно делать вывод о гениальности разработчика на том основании, что он написал прикольный перловый скрипт (все умеют писать перловые скрипты) или научил сервера компании справляться с нагрузкой в 30 млн пользователей в день (таких сайтов пруд пруди).
Мужчина просто хотел сказать, что задачи которые стоят перед фейсбуком интересней с точки зрения зарплаты и самореализации. Где вы там увидели про говнорашку? Понятно, что в доме повешенного не говорят о веревках, но неужели так все плохо?
Патриотам про гугл и газпром
Мужчина в моем лице просто хотел сказать, что товарищи у руля, по причине собственной ограниченности, сделали газпром "национальным достоянием", а яндекс забыли. И это им, по возможности, нужно объяснять. Где вы там увидели про говнорашку? Понятно, что в доме повешенного не говорят о веревках, но неужели так все плохо?
Патриотам про яндекс и гугл
Мужчина назвал яндекс "провинциальным". Его тут же поправили, обратив внимание на долю яндекса в 1-2% в глобальном масштабе. Гы-гы. Понятно, что создателям локального поисковика не стоит говорить об их провинциальности, но неужели все так хреново?
Хочу добавить, что яндекс запустился в 1997, а гугл в 1998. И на мой взгляд, именно, глобальность/локальность, мышления определила сегодняшнее положение дел на рынке.
А апорт первый раз показали вроде в 1996. судя по всему, он должен был поработить мир к 2001-2002 году.
А альтависта - вообще в 1995 году родилась...
на рынке с огромной конкуренцией, среди конкурентов компании с огромным капиталом, огромными человеческими ресурсами. Finereader Parallels - тоже продукты гениальных разработчиков, тут я с Вами на все сто...
Да вы не со мной согласны, а с кем-то другим. При чём здесь гениальность?
Вы тут систематически путаете гениальность с тиражом.
Напомните, в чём гениальность разработчиков Касперского или Абби? ну какие там гениальные научные работы или гениальные, всем известные алгоритмы, патенты и прочее? Продукты хорошие, решения умные, да.
Вот Лёхин пример про Адоуб и Фотошоп выше - безусловный лидер, продукт всех времён и народов, где там конкретно гениальность?
Чтобы построить глобальный продукт, нужны каналы сбыта, локальные офисы по миру, глобальный маркетинг. Это решает. Вот этим ЛК, Абби, Параллелс и занимались последние годы. Качество здесь является необходимым, но далеко не достаточным компонентом. Первый ли Касперский по качеству - вопрос не очевидный. По одним тестам да, по другим Симантек с Маккафи гораздо круче. А вот то, что он глобальный игрок - очевидно.
А уж гениальность разработчиков не является даже необходимым компонентом. Достаточно высокого профессионализма и умения угадать требования рынка в момент появления или подъёма рынка.
Гениальность можно приписать создателям С++ или Юникса, Виндов или Мака в начале карьеры, Интернета и браузера, и в других подобных случаях.
Насчёт локальности гениев: конечно, бывают такие, это вообще самый частый случай.
Ну вот Шекспир тоже глобальный гений, так? А сколько ещё вы читали английских поэтов? Их там десятки великих. Сколько вы знаете? А сколько читали из тех, кого знаете? Киттса, например?
Сколько вы знаете хитов всех времён и народов из детских и праздничных песен англичан? Вряд ли много, их нужно в детстве было слышать - по ним даже в 20-м веке засланных шпионов вылавливали. Ну разве что одержимый Западом человек без корней споёт зачем-то на собственном деньрожденьи Happy Birthday.
А англичане сколько знают наших хитовых и вечных колыбельных, праздничных, застолльных песен? Да нисколько.
То же самое с Фетом или Ахматовой - кто их читает в англоязычном мире? Да почти никто не читает.
Да, с прозой полегче, её перевести проще. Да и то, скажем, бывают аномалии гениальности. Воннегут у нас популярнее, чем в США, насколько я читал. На съезде фантастов в 70-х кто-то из американцев удивлялся, что Воннегут так популярен в СССР. А он у нас очень хорошо переведён, сказали ему русские фантасты. "- А, ну да, Курт очень проигрывает в оригинале" - ответил тот.
Конечно, нет. Глобальность Гугла и локальность Яндекс определились не мышлением, а наличием среды и денег.
Разрушенная депрессивная страна в начале девяностых или бурлящая от денег Долина - разные вещи.
Где бы Яндекс взял 20 миллионов долларов на железо, которые Гугл получил буквально в самом начале? И следующие?
Возможно на этом примере его алгоритм не будет выглядеть успешным...
Деньги были и в то депрессивное время.
Ответ на ваш вопрос дает Сегалович:
"> Не умеем мы это, никогда не умели, и уметь начинать не хочется. "
Игорь, Вы, наверное, шутите. Вы и вправду думаете, что общаетесь с идиотами?
Воннегут и, например, Шекли и Брэдбери, а также ряд других очень неплохих фантастов (насколько это можно говорить о Воннегуте, все же фантастика для него была только инструментов) были популярны в СССР за свои левые взгляды, а не за величие своего творчества (которым обладали, в США они активно читаются). Другой пример - Джанни Родари. Не так уж популярен на родине, но любим в СССР. За что? За левые взгляды.
Большинство этих хитов несомненно приятны для слуха, но гениальностью не отличаются
Времена года Вивальди, 5ый Брандебургский концерт Баха, Мессия Генделя, Моцартовский Eine Kliene Nachtmusic, 5ай симфония Бетхована, Fantastique Берлиоза, итд гениальны не тем, что прикольны и любимы современниками в стране композитора, а тем что полностью поменяли понятия о музыке в свое время среди композиторов разных народов.
Это и есть гениальность.
Потом, опа, версия CS, которая отличается встроенным (на самом деле - отдельным) плагином для импорта картинок с цифровых камер. И опять - эту фишку сделал Knoll.
Как разработчик - ну я не назвал бы его гениальным, я представляю как там внутри все работает, все обычное. А вот потребности пользователя Knoll два раза угадал (или сформировал) очень хорошо
В этом и гениальность :-)
Мифы про "мыслить глобально", "быть на острие", "решать сложные задачи" - только мифы :-)
Возьмите 2008 год. Страна, цветущая на нефтедолларах, Яндекс - огромная корпорация сравнимая по размеру с гуглом 2003 года, огромное число разработчиков, а воз и ныне там - маленькие локальные задачки. Парочка тысяч гугла в 2003 году сделала поиск (а также карты итд) для всего мира, а полторы тысячи яндекса работают на поиск для одного процента мирового траффика и мирового интернета.
Вообще, тема абсолютной гениТальности раскрыта чрезмерно. Остаются только вопросы связанные с размерами Ваших личных гениТальностей, которые лучше решать при очной встрече. Ибо наглядней.
Игорь, Вы, наверное, шутите. Вы и вправду думаете, что общаетесь с идиотами?
Нет, сначала я так не думал. Тем более, что я вообще не знаю, с кем я тут общаюсь. Какие-то бесплотные голоса самомнения и невежества.
Но теперь начинаю и так тоже думать временами.
Я ведь вас спросил про английских великих поэтов, вы вспомнить ниасилели, стали фантастов вспоминать. Потом на музыку перекинулись. Ну и как о вас думать, в таком случае?
Я уже написал там выше, что прозу проще переводить, а на самом деле - чем проза проще, тем ещё проще переводить. Так что Конан Дойль погениальнее будет, а уж Чейз и Кинг - вообще гении всех времён и народов.
"Я распахнул дверь рукой, и он выстрели в меня пулей из пистолета".
Фишка в том, что мы вообще говорили о локальности, о том, что обязательно нужно переводить. Именно потому, что Гугл не переведён на русский, он и не занимает 80% рынка здесь, как в Штатах. Он не работает с метным рынком, вот что значит "переведён".
Вообще там, где есть сильный локальный игрок, понимающий рынок, Гуглу непросто.
А то, что Яндекс мог бы стартовать глобальный проект и не сделал этого - правда. Это очень непростое решение, лежащее исключительно в бизнес-области, потому что никаких особенно новых технологий им бы не потребовалось. Только решение потратить десятки миллионов долларов на железо и создание кластерной платформы с распределённым индексом. Понятно, что когда у них были сотни тысяч, нужны были миллионы, а когда уже были миллионы, нужно было тратить уже десятки, то есть занимать, двигаться в долях и т.п. Но это было возможно (да это и сейчас возможно). Хотя сейчас десятки миллионов у Яндекса есть, а нужны сотни.
Думаю, им помешали ваши единомышленники внутри компании, которые поклонялись Америке как источнику силы и знания и ужасались самой идее играть глобально для маленького провинциального игрока.
А вот Касперские и Абби такое решение приняли с самого начала и выиграли.
Становиться ведущим инженером по кручению гайки №6 ключом на 18?
"Да вы ох..ли" (как говорили избиратели Монголии про гусиную х...ню)
Леха, ну а ты откуда знаешь-то ? Ты же никогда в таких местах не работал.
Потому что достаточно послушать что именно обсуждают друзья-коллеги, работающие в таких местах (а их навалом, я довольно общительный) - и сразу не хочется.
Ну и что же ? Без имен-фамилий-интимностей. А работать, конечно, нужно в вашей шаражке. Кстати, не подскажешь, что вы сделали значимого за последние пару-тройку лет ?
Вот Фабрис Беллар не спешит работать ни в adobe, ни в parallels/vmware
http://en.wikipedia.org/wiki/Fabrice_Bellard
а спокойно занимается ffmpeg и qemu. Что по алгоритмам вовсе не уступает названным выше продуктам.
Падшая женщина, это бородая байка, которую, кажется, Довлатов придумал (могу ошибаться насчет Довлатова). Воннегут очень и очень популярен в США. Причем среди молодежи тоже. Гораздо популярнее, чем в России, где про него почти никто не знает. Это понимаешь, когда приходишь в гости, а там Воннегут на диване. Летишь в самолете, а молодая девушка рядом читает Воннегута. Видишь Воннегута у коллеги (правда русскоязычного) на работе.
Завязывайте, короче, со своими глобально-локальными дискуссиями. Я это все так вижу: те, кто работает-живет за рубежном, включая меня, убеждают людей, почему нужно жить глобально. Те, кто сделал свой домик в деревне - почему - в России интереснее. Удивительно, до чего людей довел постер на две страницы.
Но только речь шла там про 70-е (а мне кажется, что вообще 60-е) годы.
Воннегут с тех пор находился в США и писал как заведённый. А в России его практически не переиздавали с начала 90-х, то есть почти 20 лет. Естественно, он стал почти неизвестен, несколько новых поколений выросло.
А вы ересказываете свой эмигрансткий опыт здесь и сейчас, думая, что он абсолютная истина.
Дискуссия здесь была не про то, что "надо жить глобально". А про вашу гордость неофитов, что круто может быть только в США. Это стандартный эмигрантский синдром, не находите?
Да вы и не живёте глобально. Вы живёте именно в США, в стране, которая нагибает или старается нагнуть весь остальной мир, которая бомбит кого не попадя и так далее. Это страна только в том смысле глобальна, что хочет быть мировым начальником и жандармом.
Ну и ладно, дело ваше, живите. Только пальцы не гните: вы там приживальщики, интеллектуальные таджики. Да, вы свою тамошнюю зарплату наверняка отрабатываете, но мощь и слава этой страны не вами созданы и к вам не имеют отношения. Вы просто как тот Мойша, который уехал на Брайтон из Жмеринки и теперь Жмеринку презирает, безо всякого на то основания. И свысока смотрит на глупых родственников, которые приезжают в гости.
Ну и причиной дискуссии послужил не сам пост, а ваши оттопыренная губа и отогнутые пальцы. Слова про мелкие задачи, провинциальность и прочее. На самом деле, провинциальность - она никуда не девается.
Можно вывезти Мойшу из Жмеринки, но Жмеринку из Мойши не вывезешь.
P.S. Это я специально вас провоцирую, а то что-то вы стали как бы примирительно закругляться.
В провинциальной Америке есть такая странная черта, все считают, что они лучшие
Каждый маленький ресторанчик в Аризоне или Техасе пишет "лучшие куринные крылышки в мире!", "лучшие шашлыки в Аризоне", "лучшие такос за пределами Мексики!". Конечно, ни в одном из их ничего особого примечательного нет.
В общении с руководителями российских фирм я заметил подобную тенденцию. "У меня сотрудники гении!", "мы уникальны, таких как мы в мире нет!". Причем на конкретные вопросы вроде "в чем проявляется гениальность сотрудников", "что особого, инноваинного сделали эти гении", "в чем заключается ваша уникальность" , эти руководите российских фирм ответить не могут.
А что itman еврей?
Гомифобов-то уже осудили.
Понятия не имею, кто такой Итман.
Эмигрантский синдром у всех одинаков, независимо от национальности.
И связан с постоянной потребностью напоминать себе, что не зря уехал.
А это можно сделать одним способом - гнобить место, откуда уехал.
За провинциальность, мелкость, местечковость. Неизбывную неглобальность.
Я-то здесь при чём? Я про гениальность своих сотрудников ничего не говорил.
То, что Вы, Игорь, анекдотами мыслите - это хороший пример Вашего мышления. Зачастую очень спорными анекдотами. Кстати, надеюсь, Вы поняли, что высказывание вначале моего предыдушего поста - это междометие :-))) а не обращение. Надеюсь, что Вы поняли, а не обиделись. Кроме того, Вы меня вечно путаете с другими людьми, что-то там когда-то говорившими про жизнь только там и только тут. И по поводу мышления, наверное, такая же путаница. Я не обижаюсь, нас таких много, а Ашманов - он один.
То, что работа программиста на американскую компанию в среднем интереснее и приятнее, чем на российскую, это практически очевидный факт, который даже наверное такие зубры, как Сегалович и Ашманов в глубине души понимают, но просто признать боятся. Спорить о том, где лучше - очень глупо. Когда в начале девяностых в России было сааавсем плохо, этот вопрос был более или мнее очевиден. Теперь, когда в и России можно заработать на (кон)домик и гольфик, он спорный.
Этот факт очевиден, если и когда уже выбрана система ценностей. Сначала нужно определить, что такое интереснее, приятнее, в общем, лучше.
Когда в начале девяностых в России было сааавсем плохо, этот вопрос был более или мнее очевиден.
Не совсем. У нас в голодный 1991 уехала вся команда, которая делала ОРФО 1.0. Ехали всем колхозом, на подготовленное место. На меня с женой тоже был контракт, но я не поехал. Последние уезжали 21 августа 1991 года, если вам это ещё что-то говорит.
Я не поехал. Хотя до этого побывал в Штатах и посмотрел, как что. Для меня там оказалось не лучше.
Так вот уезжавшие оставили здесь стариков, которые перемерли. Про разрыв с друзьями уж не говорю. А дети приехали в первый раз уже на могилы. Когда лет через семь-восемь дали гринкарту (и они уже не боялись, что визу обратно не дадут).
Так что лучше - это очень по-разному. От человека зависит.
Да, уезжая, они мне говорили, что для родителей так тоже лучше - так они хоть денег будут присылать, а так, мол, что. А приезжая потом, постоянно сравнивали "у нас" и "у вас" и уезжали с твёрдым чувством, что всё было не зря. "У них тут" - херово. Причём всё, во всех аспектах. А как же иначе.
А у меня в 1994 отец внезапно заболел раком и умер. Я его держал за руки, когда он делал последний вздох. Для меня это - лучше. И бабушка пролежала последний год в соседней квартире, я нанимал круглосуточных сиделок, умерла на глазах. Им так было лучше. А так бы я уехал в 1991, писал бы письма, узнал бы о смерти из звонков, приезжал на могилу и оправдывал себя всякой хернёй про материальные блага, про лучше для меня.
Сейчас отъезд не такой кардинальный поступок, а если в 20 лет, то и не такой судьбоносный, родители ещё молоды, детей нет. Но всё равно "лучше" - очень зависит от.
У нас в компании, кстати, говоря, нет утечки умов - отъезд в США не является конкурентом при найме и потом тоже. Видимо, у нас работают дураки, ведь умные обязательно уедут в Штаты.
Но не хватит ли? Тут не только дураки бывают.
В платье красивом? Стоите? Вот это фантазия, камрад.
Просто отъезд в другую страну - это всегда моральный выбор, а не прагматический. Потому что ты разрываешь кучу связей ради лучше, мир посмотреть и т.п. На это нужно смотреть трезво. Я в 91 году был дурак-дураком, хорошо, что чудом не уехал. Сейчас уже понимаю.
Но я вижу, вас зацепило, сразу пошли обиды. Это показательно. Кстати, в западном мире вообще не принято публично разговаривать о смерти, её как бы не существует. Упоминание - неприличный поступок. Ну уж извините, пацаны.
Вы даже совсем невнимательно прочитали то, что я написал много раз. Я написал на западную компанию. Специально, чтобы избежать этой гнилой за-и-против эммиграции дискуссии.
Вспомните Митричева. И то, что от Вас или из Яндекса люди не уходят, получив хорошие опционы, это еще не значит, что Гугл - Вам не конкурент. Нужно еще посчитать, сколько людей к Вам не приходят, а вместо этого уходят в Гугл. Или в другую западную компанию.
А как меня зацепило! Сапсем в шоке от красноречия и убедительности.
Это вы предлог on так перевели в уме?
Специально, чтобы избежать этой гнилой за-и-против эммиграции дискуссии.
Это вы написали про "лучше работать", А я просто пояснил, что работать на западную компанию - почти всегда штука с обременением в виде разрыва связей и покидания родных. И заодно напомнил про истоки презрения к провинциальной говнорашке.
Да, можно работать и здесь в Гугле, но что-то на лицах местных гуглеров не видно райского счастья, да и зарплаты такие же.
Что касается конкуренции по кадрам - ну тех, кто хочет уехать, удержать всё равно невозможно, а нанимать глупо. У нас проблема кадров решена, нас кадры в целом устраивают. Почему я должен беспокоиться, что конкретный олимпиадник Митричев ушёл работать куда-то там? Ум в смысле IQ или умения решать задачи на олимпиаде вообще не является основным условием успешного найма. Основное условие успешного найма - давать результат в нужные сроки.
По-моему, кстати, давать задачки при найме - чудовищная глупость, просто поглаживание эго основателей и текущего менеджмента. Я вообще не слышал о производственных результатах олимпиадников, реальные продукты делают другие люди, по-моему.
Впрочем, этот кусок дискуссии в точности повторяет уже прежде слышанное на Роеме, в том числе с участием того же Сегаловича, меня и пр. Пошли по второму кругу. Юра, наверно, может и ссылку дать, а мне местным паршивым поиском искать тот топик влом.
о вреде эмиграция Вы пишите простые понятные, но анекдотичные свидетельства
"Родители умирали в одиночку". Это вовсе не зависит от того, где живет человек. Многие моих знакомых мигрантов, ездили в плохие моменты к родителям, мотаясь между США и Россией по 10 раз в год. Многие перевезли родителей в США. О разнице между жизнью пенсионера с детьми хорошими инженерами или учеными в США и в России надеюсь Вам говорить не надо.
"гринкарт по 7 лет". Почти все русскоязычные моего круга получили гринкарт в срок до двух лет, многие менее, чем за год.
Если Вы подаете как OR (Outstanding Researcher) Вы получаете ее почти мгновенно (менее, чем за год), Америка любит мозги. в отличие от России, которой наплевать на Вашу степень и которая даже не признает научные степени, полученные в зарубежных университетах
А что нужно делать при найме?
Расколет любого под орех.
Можно подумать, США признает степени, полученные в России.
Это зависит от страны рождения, скажем японцы получают быстрее, чем китайцы, а украинцы быстрее, чем русские
и от степени
OR требует хорошего СВ и пяти рекомендация от приличных ученых. Пролетает быстрее, чем за год.
Это еще от штата зависит.
Ясно что. Собеседовать по тому предмету, которым будет заниматься потенциальный работник. Проверки айкью и олимпиадные задачки - от лукавого.
Психологически опросы. Будет ли испытуемый исправно кричать корпоративные кричалки и выезжать в Сосновый Бор и прочие подмосковные дома отдыха на "корпоротив".
Будет ли лоялен начальству.
-Ваша компания подает на тендер на большой и денежный госпроект. Вы узнали, что Ваш начальник договорился об откате с госчиновников ответственным за тендер
1 Вы сообщите об этом в правоохранительные органы
2 Вы скажите начальнику, что он не прав
3 Вы сообщите высшему руководству миру, что Ваш начальник договориося об откате
4 Вы ничего делать не будете
Конечно, признает
Вон спросите у Юры Лифшицы, который получил кандидатскую в Питере и устроился в Яху, а также многочисленных русских ученых на професорских должностях в США и Европе.
Наши кандидатские там обычно приравниваются к их магистерским. Но может и повезти, конечно.
> Вон спросите у Юры Лифшицы, который получил кандидатскую в Питере и устроился в Яху.
Как устройство в Яху связано с признанием США российских степеней?
А начиналось, начиналось-то с SEO ссылок ;-)
Кем признается? Очевидно, Вы говорите не про исследовательские компании и университы, которые признают наши кандидатские. Видимо, Вы говорите об иммиграционных службах. Чем будет признана Ваша кандидатская зависит от той компании, которая пишет оценку Вашего образования. Если у Вас кандидатская и есть хорошие работы, то они могут приравнять вас в западному PhD
http://asebrant.ya.ru/replies.xml?ite...ncrnd=2034
Ну, наверное, в ресторан водить нужно ;)
Может лучше про реактор?
Создайте уж отдельную тему про ИТ-эммиграцию и обсуждайте там. Каждое обсуждение с большим числом комментариев стало сводиться к рассказам "почему я работаю на американскую компанию".
Чтобы всё же закончить про это:
о вреде эмиграция Вы пишите простые понятные, но анекдотичные свидетельства
"Родители умирали в одиночку". Это вовсе не зависит от того, где живет человек.
Это всё верно. Но дело в том, что я рассказываю не анекдоты, а реальные случаи, которые наблюдал сам. Остальное может быть обобщением - а ведь вы тоже смотрите на то, что происходит с вами и вашими знакомыми, но потом бестрепетно обобщаете. Более того, я писал о начале 90-х, а вы берёте свой сегодняшний опыт и выводите, что мои примеры неправильные и нетипичные. В 90-х выехать было труднее, получить визу труднее, вывезти родителей ещё труднее и т.п.
Конечно, если смотреть на это беспристрастно, виза, океан, работа заведомо создают дополнительные барьеры и разрывают связи. В любом случае уехавшие не видят своих престарелых родственников каждый день, не говоря уж про друзей. Конечно, жлобство конкретного сыночка может создать такой же барьер и здесь. Ну да ладно, что тут обсуждать, каждый решает для себя и обустраивает свою жизнь, как ему лучше.
Просто не надо представлять дело так, что работать в США однозначно лучше и в Яндексе или Мыле работают сплошные провинциальные неудачники.
Насчёт задачек - нет, меня звать на собеседование не надо, я психологически не гожусь для собеседований, слишком располагаюсь к интервьюируемому, не могу воспринимать критически, поэтому всегда прошу других партнёров компании разговаривать с программистами.
Но задачки - это настолько распространённый миф, тесно связанный также и с "олимпиадниками", что надо было его зацепить краешком.
На мой взгляд, задачки почти не выполняют свою роль фильтра, а решают пиар-задачи, а также задачу удовлетворения самолюбия тех, кто уже в компании работает. "Мы тут все умные и ты должен доказать, что не глупее". Масонский такой ритуал.
Умный парень или нет - легко понять и так, поговорив десять минут; есть квалификация или нет - легко выясняется серией вопросов про предыдущие работы и чтением резюме. А вот будет ли устойчиво работать, нет ли личностных проблем и т.п. - задачками не выясняется, более того, ореол успешного решения таких задач может вуалировать проблемы.
То есть вступительные задачки решают не деловые, а идеологические задачи.
Мне кажется, задачки дают там, где пытаются создать секту "умных", это ритуал инициации для поддержания сплочённости и боевого духа, как обрезание или татуировка одростков у диких племён. Посмотрите, где их дают и спросите себя - "там секта?". Думаю, корреляция будет высокой.
Как метко подметил один мой знакомый лучше быть CTO в российской компании, чем программистом в американской. А если сравнивать америка против России для одного и того же уровня, то лучше Америка. Дело даже не в лучшем жизненном уровне, безопасности от криминала, дело в стабильности. Российский программист не может ничего планировать на пять лет вперед. Помните, как кандидаты наук в 1987 планировали? Получу доктора, потом квартиру, со временем машину. А вместо этого получили сбор и сдачу стеклянных бутылок потому, что денег на еду не хватало, а кто на машинах "бомбил" (один весьма известный и уважаемый ученный-физик).
из олимпиадников, которых я знаю мало кто стал хорошим ученным, но много отличных программистов, работающих над проблемами статистического анализа, оптимизации, веб поиска, создания быстрых ядер для баз данных.
Сама структура олимпиадных задач очень похожа на задачи в этих областях -- найти какой-то "умный" хак, который задачу с оптимизирует или вытащит нужные данных из хаоса, при этом задачи обычно сравнительно маленькие по с точки зрения времени и умственных усилий по сравнению с наукой (фундаментальной, а не статьи SIGIR/WWW равные тем же олимпиадным задачкам)
Так что если вы хотите набрать народ в веб поиск, оптимизацию ядер баз данных, то вам надо брать "задачо решателей"и прочие характеристи умного парня вас мало интересуют.
Умный парень, решающий задачки не зная с++, через месяц будет равен "опытному программисту" с 5 летним опытом с мозгом не заточенным на решение задач, а через год это переплюнет любого "опытного программиста, 10 лет в индустрии" с бесконечным разрывом
Если Вы нанимаете на работу, посмотрите на индийских ребят из хороших IIT (почти все крупные задачи современного ИТ в той или иной степени решены ими)
Образование там плохое, никаких фундаментальных знаний нет. Но, у них конкурс 200 человек на место, и выигрывают его действительно лучшие. В любой области они через месяц будут равны опытным середнячкам с пятилетним опытом, зачем требовать от них знания "дизайна и паттернов", "архитектуры" "конструирования систем с большими нагрузками", они овладеют этими знаниями через пару месяцев, а то чем не овладеют сами придумают.
Джисус Крайст говаривал: - "Пусть прошлое хоронит своих мертвецов." Ваше дело - будущее.
Если ваши отцы-деды обеспечили вам нормальный паспорт, будьте добры обеспечить детям такой же, но не пропуск на нефтехранилище. Сдается мне, что в этом смысле больше шансов у амэриканских заокеанеров.
Не говоря о том, что воспитание без бабушек - неполноценное.
А вы за себя не сцыте. Все будет ровно, Джисусу стоит верить.
Как можно написать, скажем, модель ядерного взрыва без фундаментальных знаний? Отобрать из 200 полуграмотных (по вашим словам) самого достойного - это большое достижение, так?
> Джисус Крайст говаривал: - "Пусть прошлое хоронит своих мертвецов."
Вы опять нифига не поняли. Ни "в этой" стране, ни "в той".
> Ваше дело - будущее. Если ваши отцы-деды обеспечили вам нормальный паспорт, будьте добры обеспечить детям такой же.
А потом спрашивают, а почему у нас всё так плохо.
Полуграмотный выпускник ИИТ имеет весьма неплохие познания в математике и заметно похуже знания в информатике. Скажем на уровне не лучшего undergraduate западного университета. Этого недостаточно чтобы построить модель ядерного взрыва, но за 2-3 месяца вполне можно наверстать базовые знания в какой-то одной области (конструирование компиляраторов, оптимизация запросов для много терабайтных БД) и успешно работать в этой области
Да, именно так :)
Ну, тогда он не полуграмотный :-). Если вы хотели сказать, что отсутствие каких-то глубоких знаний по программированию можно наверстать за n месяцев усиленного натаскивания, при условии наличия хорошего физмат-базиса = я с вами согласен.
Видимо, не так понял вначале.
хотя опыт реальных проектов всё равно решает. А опыт + физмат-базис = вообще разрывает на куски.
Игорь, если в IT компании среди программистов нет "секты", то это значит:
1) либо там работают одни неопытные студенты, у которых еще не сформировалась точка зрения на то как правильно все делать.
2) либо сотрудникам все по барабану и они работают по принципу "мне башляют - я фигачу"
>Посмотрите, где их дают и спросите себя - "там секта?". Думаю, корреляция будет высокой.
Посмотрите, где их НЕ дают и спросите себя - "там секта?". Думаю, корреляция будет высокой.
Это так, о логике статанализа ;)
Все гораздо лучше ( = хуже). Секты зловешшше сплетаются в социально-сектантские сети.
Гугл - ясно, секта, задачки дают.
Микрософт - секта? Не совсем ясно. Задачки дают.
Абби - точно секта. Задачки дают.
Мыло - не секта. Задачек не дают, вроде?
Рамблер - не секта. Задачек не дают.
Яха - не секта? Задачек не дают?
Одноклассники - не секта? Задачек вроде не дают.
ВКонтакте - неизвестно. Про задачки неизвестно. Наверно, секта, раз такая секретность. Или банда.
РБК - не секта, скорее банда. Задачки не дают.
Мы делаем обрезание и татуировку, это лучше работает.
http://clubs.ya.ru/company/replies.xml?item_no=16790
"татуировку одростков" (ашманов 01.06.2009 09:24:30 )
И как одростки?
ничего не поутихло ;)
Мои поздравления, молодцы (особенно -- молодец :) !!!
> Для разогрева:
> http://clubs.ya.ru/company/replies.xml?item_no=16790
To iseg:
>Статья научного сотрудника Яндекса Дмитрия Павлова (Yandex.Labs) ...
>
Ой что это?
http://www.kdd.org/kdd/2009/papers.html
Large-Scale Behavioral Targeting
Ye Chen* Yahoo! Labs; Dmitry Pavlov Yahoo! Labs; John Canny Computer Science Division University of California Berkeley
----------- Yahoo! Labs -----------
^^^^^^^^
По-видимому, теперь можно сказать, что все публикации Yahoo пишутся сотрудниками Yandex.
Зря была вся эта дискуссия - сколько публикаций у Яндекса!
Abstract Submission: February 2, 2009 23.59, Samoa time (GMT-11) (Expired)
Electronic Paper Submission: February 6, 2009 23.59, Samoa time (GMT-11) (Expired)
http://www.linkedin.com/pub/dmitry-pavlov/2/a7b/95
Director of Research and Data Mining
Yahoo!
(Public Company; YHOO; Internet industry)
December 2006 — February 2009
Пока он этот paper писал, он еще в Yahoo работал
Ай-яй-яй, недоглядели пиарщики из Яндекса :)
Игорь - ты не прав. Есть огромное количество людей, которые могут достаточно складно рассказывать о том какие у них предыдущие проекты и опыт, написать отличное резюме, но работать не умеют. Сейчас у нас на собеседовании программиста просят на ноуте написать кусочек кода. Не олимпиадный - просто из жизни. Ты не представляешь сколько складно разговаривающих умных людей с многолетним опытом не могут написать программу размером в 100 строк, которая на старте не падает.
Мнение, что в Яндексе дают "задачки" наверное частично обосновано. 5 лет назад тут вообще никто не знал, что спрашивать человека на собеседовании. Их и сейчас по инерции дают - только уже приближенные к реальности, и факт их решения не играет решающую роль в принятии решения. Но с моей точки зрения посмотреть на код наиболее хорошо кореллирующий с полезностью человека фактор.
> А вот будет ли устойчиво работать, нет ли личностных проблем и т.п. - задачками не выясняется, более того, ореол успешного решения таких задач может вуалировать проблемы.
А что касается личностных проблем. Ну сам же рассказывал на РИТ как выглядят хорошие программисты. Они бывают маленько невменяемые с точки зрения нормального человека. Так зачем их отсекать по этому признаку. Если особенности характера мешают работать, ну расстанемся. Если не сильно, то этот человек может оказаться не смотря на странности тем самым "гениальным" программистом.
Да и с программами не так все просто: само по себе собеседование - стресс, а если вдобавок испытуемый может программировать только в измененном состоянии сознания и ему на каждые 100 килобайт гениального кода нужно две дорожки и пять раз дунуть? Система с написанием программы на входе (не в привычных/комфортных условиях) будет уверенно отбирать именно олимпиадников, тренированных на стресс.
На мой взгляд, самое важное на собеседовании - это установить, можете ли вы с испытуемым коммуницировать. Если не можете (система понятий-умолчаний не совпадает), то ничего хорошего не получится в любом случае - даже сверхгениальный человек потребует чудовищных расходов на управление.
А почему Сегалович написал, что статья сотрудника Яндекс?
Там же явно написана аффилиация
Ye Chen* Yahoo! Labs; Dmitry Pavlov Yahoo! Labs; John Canny Computer Science Division University of California Berkeley
и компании обычно не присваивают себе результаты сотрудников, которые разработаны в других компаниях
Вон, в ИБМ Микрософт и прочих когда собирают список статей наших сотрудник явно указывают "присылать только статьи разработанные у нас и в которых аффлиация - наша компания"
Или Яндекс уже в полной despair?
1) еще раз поздравления – с удачным приобретением :)
2) а про введение в заблуждение – разумеется, заслуживаете вытутаировки одростков ;) До основанья. И затем ;)
Все русскоязычные теоретики ИР (Борковский, Дима, там еще какой-то было индексом занимался) из Яху перешли в Яндекс, может на техкранч выкинет, это забавно.
А откуда директор? Он же только доктора получил в прошлом году и статей совсем не много.
Но вообще мы же все привыкли к ситуации кадрового голода (2003-2008-го годов), когда брать приходилось что дают и таки да, доучивать, тренировать и все такое. Т.е. выбора большого и не было, если на вакансию возникал реальный выбор (среди потенциально сильных) - это было удивительно.
Яндекс Лаб в Бирлингеме по-прежнему нанимают народ
http://www.eltisolutions.com/Eng_and_...d_sse.html
http://www.eltisolutions.com/Eng_and_...x_cpp.html
Леня, а ты собираешься в кремниеводолиновый Яндекс?
Тебя бы туда директором взяли или принципальным инженером, ездил бы в Москву большим барином, бывшие начальники с поклоном будут тебе кофе подавать и кланяться.
Ну хотя бы один, пусть самый маленький, но все же как бы и результат :)
Доказали, что в Яху, Майкрософтах работают не боги, а даже ровно наоборот. Ну и задолбали всех.
Там работают над секретными проектами. С чего вы взяли, что какие-то данные будут опубликованы в сети?
Инфраструктура яндекс улучшается, строится бОльшой индекс, новый поиск отвечает на английские вопросы, Вам этого мало?
Поиск Яху по-прежнему очень сильный, непрерывно появляются новые иновационные фичи.
Попробуйте Бинг
Смех смехом, мы тут с одногруппником обсуждали наш курс
Те кто сдал приемные экзамены в институт успешны, а те кто не очень - не очень успешны
Четкой корреляции нет, но если разделить 20 балов приемных экзаменов на группы
16 и ниже
17 и выше
17 и выше - ученые и инженеры, весьма успешно устроившиеся на Западе и в России, руководители крупных банков и предприятий
16 и ниже - финансовые аналитики нижнего уровня иерархии в своих банках, финансовые директора каким-то мелких компаний, ученые, пишущие мало статей и работающий в третьеразрядных университетах
Конечно есть разбросы в распределении, но в основном искуственные . 15 бальники у которых успешные предприятия, потому, что родственник обеспечил госзаказы итт
Вообщем, Ашманову я не стал бы пренебрегать способностью решать задачи, это много говорит о человеке.
Мне тоже так казалось, но экспериментальные данные на сотне человек вполне доказывают, что корреляция есть (при significance level 0.05) как это ни странно. Так что тут или казуальная зависимость или какие-то скрытые переменные которые ответственны и за то, и за другое
Такие дела
Миша
Не думаю, что говорит.
Более того, хороший балл на вступительных говорит тоже не об умении решать задачи, а о совсем других способностях и навыках.
Поясню на примере: если кандидат на вакансию - кандидат наук, о чём это говорит? Это почти ничего не гарантирует относительно его будущих достижений в компании, но как минимум он он довольно сложный проект в своей жизни довёл до конца. Причём этот проект включал в себя не только изолированное умение чего-то там решить, но и умение договариваться, работать совместно, организовывать, писать документы и успевать в сроки.
Это всё важно, особенно для менеджера.
Вот и высокий балл при поступлении, особенно в хороший ВУЗ, показывает не изолированное умение решать задачки, а также упорство, умение готовиться, стрессоустойчивость, социальный интеллект, социальное положение и т.п.
Главное, что умение решать задачки являет только необходимым навыком, но далеко не достаточным. Поэтому, если кандидат кончил, например, Мехмат или Физфак МГУ, Физтех или МИФИ (список неполный), то вообще задачки решать он гарантированно умеет, тогда зачем они на собеседовании? Гораздо интереснее наличие интереса к делу, опыт, коммуникационные навыки, наличие собственных идей.
Если ещё не читали, то советую почитать Джоэла Спольски про то, как собеседовать программистов, очень разумные вещи он пишет: http://www.joelonsoftware.com/article...wing3.html
Умение решать не достаточный, а необходимый навык.
Все же необходимый, а значит проверять его надо
В целом, конечно, кандидаты с физтеха и мехмата со средними баллами около 4.75 и выше всегда были хорошими
таких можно брать не глядя
Правда, в последние годы там обучение резко ухудшилось и я не стал бы доверять дипломам так как раньше
Конкурсы принципиальное не сравнимые, как математическая олимпиада с задачами "на смекалку" и SAT GMAT etc экзамен где надо решить много очень простых задач быстро.
В Эйлере задачи простые, не более часа на каждую, два часа на самые-самые тяжелые и побеждает тот кто может посвятить несколько месяцев по два часа в день на то, чтобы решить две сотни задач.
Можно, конечно, но можно сделать какой-то проект, принести пользу людям, два-три месяца вечернего времени это большая затра
ДенДен, а это не Вас я привел в 30 минутный ступор задачей
кидаем монету, она падает на решку, то есть статистика из одного кидания одна решка,
с какой вероятностью монета падает на решку?
Опровергает ли падение на решку гипотезу, что монета с равной вероятностью может упасть и на решку, и на орла
Но то, что вы написали, приводит меня в ступор, да.
Не ясна постановка задачи. Что есть "монета"? Если привычная для задач по тер. веру материальная реализация бернуллевской случайной величины с вероятностью исходов {1/2, 1/2}, то ответы очевидны.
Если автор пытается сообщить нам, что "монета" - это объект с вероятностью исходов {p, 1 - p} и просит найти p, то в этом случае, если пользоваться методом максимального прадоподобия, то да, p = 1, монета падает только на решку.
Ну да, это почти так, смотря что называть сектой, правда. Игорь, а что плохого в секте? Что плохого в ритуале посвящения? В команде, которая решает большую амбициозную задачу обязательно будут элементы сектантства. Просто потому что большие задачи в одиночку маньяками не делаются. Начинаются — да, но потом этот маньяк начнет культивировать секту.
На мой взгляд, где нет "секты" (в вашем понимании) — нет и процесса решения задачи.
LOL:)
Проверка гипотез по одному наблюдению - жто реально круто, а вот сам доверительный интервал по одному набл. - круто уже просто нереально.
На мой взгляд, где нет "секты" (в вашем понимании) — нет и процесса решения задачи.
Да, это примерно так:
а) исходный продукт создают увлечённые люди с большой харизмой.
б) большая харизма вовлекает второй слой адептов, нанимаемый во что-то вроде секты.
в) иногда это начинает фиксироваться в виде ритуалов и иерархии, речёвок, задачек при поступлении, тимбилдингов, людей-легенд и т.п.
Проблема только в том, что это
а) секта - всегда влбом случае виртуальная реальность, то есть некий ментальный слой поверх реальной жизни;
б) иногда секта создаётся не в интересах добра и разума, а для рубки бабла с лохов, как в компаниях сектора МЛМ или спамерских, например;
в) самое важное: это всё работает только на начальном этапе, а когда бизнес входит в регулярную фазу, сектантство начинает сильно мешать - что и можно было наблюдать во многих компаниях, включая Яндекс.
На этапе регулярного бизнеса внутреннюю секту надо потихоньку изживать, а всякие фиксаторы вроде ритуалов инициации этому мешают, фиксируют состояние секты. Отсюда и возникают феномены 1937 года с избиением "старых большевиков", которые уже неадекватны задачам, но зажрались, крепко держатся за иерархию и власть.
На мой взгляд, секта не даёт покоя только дураку аудитору, у которого оценка компаний идёт по галочкам и пунктикам:
— разделены ла разработчики и админы? у кого из разработки есть доступ на сервера?
— как выстроен регламент? как происходит этап внедрения?
— можно ли быдлокодера А заменить быдлокодером Б?
И каждый балл даёт поправочные коэффициенты, что влияет на виртуальную стоимость компании. Только вот это тот самый процесс изживания секты разрушает саму команду, приводит её если не к полной импотенции, то уже точно к неспособности создавать новое. Это уже не маленькие тигрята, которые покорят мир, это стадо полудохлых дойных коров, которых через какое-то время отправят на бойню.
Теперь самое главное? Исчезла ли секта? НЕТ! Теперь она переросла в корпоративную религию с новыми божествами. Религию, в которой уже нету «общего дела», но зато есть личные интересы, желание встроится поудобнее в систему, выстроить отношения. В такой команде думают не о том как и что сделать лучше, а о том как сделать что-то такое, чтобы лучше можно было о себе написать в отчете. В такой корпорации уже не важно делать хорошо, важно втирать очки, писать кляузы.
Хороша та компания, которая выросла и сохранила в ядре секту. Секту, которая хочет делать продукт, а не играть в корпорацию.
Тогда - это когда?
Я разве говорил, что у нас секта или пожизненный найм?
А так у вас, похоже, просто неверные сведения, вы слышали звон, но не знаете, где он.
Коваленко в нашей команде работает с 1997 года (с тех сменив МедиаЛингву, Рамблер, АиП, Поисковые Технологии). 12 лет - это называется "не задерживаются"?
Он сейчас числится в отпуске, будучи при этом акционером в одной из наших компаний. Это называется, что он не задержался? Причины отпуска у него те, что он всегда ещё был параллельно техдиректором и акционером в Мете.уа, и ещё имел пару строительных/автомобильных бизнесов на стороне, сейчас увлёкся стройкой своего бизнес-центра.
И кто там ещё от нас из "сильных разработчиков" ушёл? Хотелось бы конкретных фамилий. Я сам вспомнить пока не могу.
А вообще в уходе людей нет ничего ужасного или постыдного; люди растут, должностей для них не всегда хватает, опционы всем не выдашь. Иногда люди, наоборот, отстают от роста бизнеса, устают, женятся-размножаются, уезжают и т.п., и т.п. Одна из самых сильных причин - открытие собственного проекта, этому противопоставить что-то трудно. Инстинкт предпринимателя если уж появится, то всё. Разве что подсунуть свеженький стартап.
Самые важные, сильные, ценные становятся акционерами, но это не массовое решение.
допустим дана момент с равновероятным распределением
Подкидываем монету 10 раз
Какая вероятность выпадения пяти решек?
-Правильный ответ
Семь решек?
-правильный ответ
Монета, 0.7 вероятность выпадения 5 решек?
-правильный ответ
7 решек
-правильный ответ
А тепень наооборот
Монету, на вид вроде симметричную, подкинули 10 раз, выпало 7 решек, что можете сказать о монете?
-Ну, скорее всего, да, ну, ну, ммм, думаю, что монета кривая, вероятность выпадения решки 0.7, раз семь решек выпало, ну,, м-м-м-м-м-м, ну, 0.7 общая формула m/n
Хорошо, а если один раз подкинули и решка выпала
-ну, мм-м-м, ответ очевидный, значит вероятность выпадения решки равна 1, эээээ, мммм. (полчаса) ммм-мм ээээ ммммм
Так про это и был вопрос. "ведущий разработчик поисковых систем" "эсперт-специалист по машинному обучения" должен был разбираться в таких совершенно простых примерах и хотя бы, иметь простейшее представление о байесовском методе
Скорее даже наооборот. Когда люди не уходят, не организуют своих новых компаний и стартапов, не делают новые большие проекты в других компаниях, это говорит о том, что ценность людей мала, что они ничего не способны сделать за пределами своей компании - своего коллектива и скорее всего их должность давно превратилась в синекуру.
Это как в американских университетах. Аспирант почти обязан найти должность постдока не в том универе, где онбыл аспирантом. Если человек не способен работать не в рамках одного коллектива и одного круга задач, это говорит о том, что он плохой специалист тлт ученый.
Я не принадлежу ни к какой секте
Я вообще не работал больше, чем 2года ни в одной компании )
... увольняли нах
Чорт обидно, я уж было попкорн разложил. *Складывает поп-корн обратно в шкафчик*
Обидел чем-то?
Ну да, сразу вспомнил очень яркое и в точности про наоборот - Лейф Аззопарди. Не самый малоприметный. И ооочень общительный, по всему свету.
Я это просто так, и к тому, что правил нет = типа никаких ;) а сплошь исключения
Там не такие требования
Да, не спорю. Просто между защитой и постдокством в Глазго он успел побыть - постдоком же - ровно типа неделю-другую;) в столице кофешопов (и в этом смысле удовлетворяет критерию "не туда, откуда";) А так он из Австралии [, где много диких кенгуру]
Это кто такой?
Горе мне, горе. Задача и правда не должна вводить в ступор, ибо постановка привычна для статистики и решение тривиально.
Для уровня достоверности x, оценка вероятности выпадения решки - 1, с доверительным интервалом [1 - x, 1].
Мозг вправился.
Например то, что с вероятностью 0.9 вероятность выпадения решки находится в [0.45, 0.86].
Тьфу, что с уровнем достоверности 0.9.
PS Рашид Ильфатович, я никому не скажу, что вы читали мне тервер ;)
А в какой компании кого просили кубик-рубика собирать на собеседовании "на смекалку"? А то я слышал от моего друга в Москве....
Ожидание 0,65 что-ли?
Не может быть 0,65 в среднем
Ден? Вы что неправильно округлили или как?
http://ms.cs.msu.su/ishevtsova/2006-BEconst.pdf
Вроде гарантированная теоретически близость функций распределений
При каких априори?
Яндекс
http://yandex.ru/yandsearch?text=Рашид+Ильфатович
Гугл
http://www.google.ru/search?hl=ru&q=Рашид+Ильфатович
Что лучше?
Биномиальное распределение.
Однозначно - Гугла. Хотя это и не его заслуга, а создателя документа в 5-й позиции, со сниппетом
"Автор: Рашид Ильфатович или Вера Олеговна" .
Всегда любил трансформации. Но не знал, что и такие возможны. Понравилось
Не понял. Гуглу веб мастера помогают правильные ответы находить?
Чего?
"Автор: Рашид Ильфатович или Вера Олеговна" - по-моему,забавно.
Какие вебмастера, какие ответы? (т.е. и я "не понял")
Главное, что чел умеет на собеседованиях спрашивать про сжимающее отображение
http://denraskovalov.ya.ru/replies.xm...ncrnd=3033
А какая именно несимметричная функция распределения использовалась Вами для подсчета доверительного интервала?
или bayesian update
В первом случае получаем 0.7 в качестве ожидаемой вероятности выпадения решки и с доверительным интервалом
во втором случае все зависит от априорного распределения, но при вычисления надо начинать с априорного распределения
ДУмаю эти 0,65 скорее всего ошибка в вычислениях, видимо ошибка в округления от бездумного использования какой-то статистической библиотеки или микрокалькулятора без знания как реально вычисляется это формула
p(1-p)
Альтер, а Вы какое распределение используете для оценки доверительного интервала с уровнем достоверности 0.9? Надеюсь не считаете бездумно, что за 10 бросаний у Вас оно сходится к нормальному распределению?
OK.
Во-первых, говоря "доверительный интервал" мы не определяем автоматически методику его расчета. Есть два подхода - фреквентистский и байесовый. При фреквентистском мы не позволяем себе вычислять вероятности событий в пространстве неизвестного, но фиксированного параметра (по-английски confidence interfal), при байесовом - позволяем (по-английски credible interval). В фреквентистском мы фиксируем статистику и тест, принимающий или отвергающий гипотезу о значении неизвестного параметра, потом ищем интервал неизвестного параметра, при котором мы принимаем гипотезу при наших результатах эксперимента с нужной степенью достоверности. В байесовом мы предполагаем известным распределение результатов эксперимента, а распределение неизвестного параметра принимаем априорно равномерным. После чего ищем апостериорное распределение и ищем нужные (a/2, 1-a/2) квантили. Для биномиального распределения можно доказать, что апостериорное распределение неизвестного параметра описывается соответствующей бета-функцией. Обращая ее получим приведенный мною интервал.
Если m != n/2, то распределение бета-функции будет несимметричным => несимметричным будет доверительный интервал.
Я, наверное, запутаю, но можно решить ту же задачу проще при фреквентистском подходе. Пусть тест (Clopper-Pearson) будет следующим: при заданном исходе мы принимаем гипотезу о значении неизвестного параметра при уровне достоверности a, если вероятность попадания числа исходов в [m, n] будет больше (1+a/2) и вероятность попадания числа исходов в [0, m] будет больше (1+a/2).
Нужные скрины выкладок в mathcad (в том числе та самая несимметричная плотность):
http://img-fotki.yandex.ru/get/3602/d...0fa_XL.jpg
Интервал получается немного другим, но тоже несимметричным. Зато без бета-функции проще представить (лично мне).
На рисунке верхняя и нижняя границы перепутаны, да.
Денис, Вы чего? С каким это пор в байесе принимается равномерное априори?
В этом-то и преимущество байеса, что априори выражает наше априорное знание о распределении. В данном случае, например, мы могли бы предположить, что вероятность, что монета идеальная ... скажем 0.9 .... . Равномерное априорное распределение есть весьма частный случай байсовского подхода и почти никогда не используется
Юра, починяй экперта.
Залез в тему годичной давности, ссылок на себя наставил.
Явный спамер.
Нет никакой повторяемости и проверяемости результатов необходимых для любой науки. Доклад, что метод 2 самый точный, а метод 7 самый быстрый почти не проверяем, так как не доступен код автора, а зачастую и описание метода опускает многие важные детали реализации. Вся эта Informational Retrieval по уровню научного развития похожа на ботанику 18 века.
Но это судьба любой науки, имеющей дело с неповторимыми объектами и процессами, от геологии до социологии с экономикой: есть реальные объекты, а *экспериментов* (с повторяемостью и т.п.) - нет. И пользовательское поведение (как пример) - это те самые неповторимые процессы.
Там где возможны повторяемые эксперименты, а тем более там, где имеют дело только с моделями (включая и чистую математику) - там проще, конечно (ну или сложнее: тамошняя наука не просто должна предсказывать, но это еще и проверить легко).
ну не на ботанику, а на основные элементы теории вероятностей и дискретной математики периода 1736-1763 гг.
Набор случайных классификаций в духе "роза похожа на шиповник, а на ирис не очень похожа". Больше на ботанику, чем на теорию вероятностей. Я думаю Сегалович очень жалеет, что ушел из красивой геофизики в такую херню.
Наоборот, как раз в геофизике вполне в ходу соображения вида "если косинус азимута на северный магнитный полюс, умноженный на силу гравитационной аномалии и деленный на притяжение Венеры за 1937 год меньше 5 - то надо копать".
Вот есть красивая теоретическая геохимия. Сидишь за компьютером, хрен к носу прикидываешь, строишь красивые модели.
А есть настоящая, за кою основные деньги и платят, это когда из болотного сапога вынимаешь котлету из комаров из под коленки. Большая котлета - много комаров, маленькая - мало.
Про геофизику я меньше знаю, но подозреваю что ситуация аналогичная: есть красивая геофизика, а есть практическая т.е. настоящая, тоже с котлетой из комаров, вся разница в том, что геофизики даже в сортир на машине ездят.
Да, с теорией вероятностей и статистикой примерно та же хрень: есть чистая наука, с центральной предельной теоремой и прочими интегралами Лебега, а есть практика, которая гораздо веселее. Спросите у практиков (я - спрашиваю регулярно).
Так
у ежиковс IR то же самое.а откуда же брать предпосылки для поиска обоснований, как не из эмпирических наблюдений :)
Я не спорю с тем, что деньги зарабатывать надо, но не вижу ничего в этом особого интересного и веселого. Просто "потребность", вроде потребности по утрам ходить в туалет по большому.
Познание, конечно, важнее эффективности и "удовлетворения потребности юзеров", какой бы эта потребность ни была, в поиске информации или запивании гамбургера кока-колой
Пример про кока-колу абсолютно аналогичный. Химики с образованием в квантовой химии работают технологами для кока-колы придумывая более эффективные методы и какие-то новые цвета напитка. Ситуация. Познание и красота науки против эффективности и потребностей юзеров.
> Мне кажется, что сложный, эмпирический … гораздо красивее
Мне кажется, что сложный ни-ког-да не бывает красивым. Другое дело, сама по себе, простота, она бывает и хуже….
> приближающий нас капельку к искусственному интеллекту
Некоторые предпочитают обладать естественным.
> голых с интегралами Лебега
В IR не часто встречаются голые с интегралом Лебега, даже сам интеграл. И кстати, почему-то обычно по делу.
Оставьте Лебега в покое. Все же умер человек.