Zodyak İşareti Ile Uyumluluğu Bulun
Veri gazetecilerinin daha iyi iş çıkarmasına ve daha verimli olmasına yardımcı olabilecek 10 araç
Bültenler

Veri gazeteciliğinin kapsamına giren tüm görevlerde eşit derecede iyi olmak zordur. Sorunları daha da kötüleştirmek için (veya gerçekten daha iyi), veri gazetecileri her zaman yeni yöntemler ve araçlar keşfediyor ve uyguluyor.
Yeni başlayan bir veri gazetecisi olarak, başkalarının hayran olduğunuz işi yapmak için kullandığı araçlar hakkında bir fikir geliştirmek isteyeceksiniz. Hepsini bir anda öğrenemeyeceksiniz ve denememelisiniz. Bununla birlikte, kullanılan araçlar hakkında bir tür ortam farkındalığı geliştirmelisiniz (Facebook'un size lisedeki sınıf arkadaşlarınızın hayatları hakkında verdiği bilgi gibi). Kontrol edilecek araçların bir listesini tutun. Demoları izleyin ve belgelere veya koda göz atın. Ardından, projeleriniz ihtiyacı yarattığında, başlamanıza yetecek kadar hatırlayacaksınız.
Yine de hemen, bir veya iki araç seçin ve onları DNA'nızın bir parçası yapın. Bir alet seçin ve elinizden gelen her şeyi sıkın. Bu konuda bulabildiğiniz her şeyi okuyun. Her özelliği ve optimizasyonu öğrenin. Üzerinde kısayol tuşları bulunan bir kahve kupası satın alın. Daha kolay bir yol olması gerektiğini söyleyen sıkıntıyı hissettiğinizde yeni bir alet almaya hazır olun. Aşağıda, neredeyse her veri gazetecisinin alet çantasının parçası olan 10 araç bulunmaktadır.
1. E-tablo
Hemen hemen her veri gazetecisi elektronik tabloyla başlar. (Açıklama: Diğer programcı-gazeteciler gibi ben de burada bir istisnayım. Hesap tablolarını, onlara güvenen meslektaşlarımla çalışmak için kullanmayı öğrendim.)
Elektronik tablo, özellikle verilerinizi virgülle ayrılmış değerler dosyası gibi düz metinle ayrılmış bir dosya olarak kaydederseniz, neredeyse evrensel bir veri biçimidir. Herkesin ya zaten ticari bir elektronik tablo programı vardır ya da kolayca indirebilir. Bedava bir ve modern elektronik tablo uygulamaları oldukça çok yönlüdür.
Bir kaç tane var Siteler ve dersler elektronik tablo becerilerini geliştirmenize yardımcı olmak için kullanılabilir. Sıralama, filtreleme ve ara toplamlarla başlayın ve daha gelişmiş formüllere geçin. Formülleri kullanmayı öğrenirken, bazen onları sihirbazları kullanmak yerine doğrudan yazmayı deneyin. Bu uygulama, kullandığınız formüller hakkında size daha fazla bilgi verecek ve aynı zamanda, diğer araçları alırken kullanışlı olacak olan fikirlerinizi kodla ifade etmeye başlamanıza da yardımcı olacaktır.
2. SQL
Bir süre sonra, elektronik tabloların sınırlamalarının sıkışmasını hissetmeye başlayabilirsiniz. Birçok veri gazetecisi, birleştirilecek ikiden fazla elektronik tabloları veya sorgulanacak çok büyük veri kümeleri olduğunda ilişkisel bir veritabanı yöneticisine (örneğin SQLite, MySQL, PostgreSQL, Access) yönelir. SQL çıkarmak istediğiniz veri alt kümesini veya yapmak istediğiniz değişiklikleri tam olarak tanımlamanıza ve bu sorguları ilgili veri kümeleri arasında gerçekleştirmenize olanak tanır. Ayrıca komutlarınızı bir komut dosyası olarak kaydedebilir, böylece verilerle yaptığınız her şeyi belgeleyebilir ve bu adımları gelecekteki bir veri kümesinde otomatik olarak tekrarlayabilirsiniz.
Hemen hemen her ilişkisel veritabanı programı bir miktar SQL kullanır, bu nedenle temel bilgileri (birkaç düzine anahtar kelime ve bazı noktalama işaretleri) öğrendikten sonra, hem ücretsiz hem de ticari olmak üzere istediğiniz sayıda sistemdeki veritabanlarını sorgulayabilirsiniz. Ayrıca, verileri Web uygulamalarında depolamak için ilişkisel veritabanları sıklıkla kullanılır, bu nedenle SQL bilginiz Web geliştirmede doğrudan faydalı olabilir.
İşte bir eğitim başlaman için.
3. Veri temizleme araçları
Tüm veri kümeleri 'kirli'. Dizüstü bilgisayarınızı her açtığınızda bunu kendinize üç kez tekrarlayın.
Verileri temizlemek ve kullanışlı bir biçime sokmak için muhtemelen çeşitli araçlar kullanacaksınız. Benim favorim Google Rafine Et biraz elektronik tabloya benzeyen ancak güvenilir sayımlar oluşturabilmeniz için adların standartlaştırılması gibi şeyler içindir. (“John Smith”, “Smith, John” ve “John Q. Smith”in örneğin üç yerine bir kişi olarak sayılmasını isteyebilirsiniz). kullanma Google İyileştirme İfade Dili , karmaşık veri dönüşümleri yapabilecek ve kendinizi kodla ifade etmede bir adım daha atmış olacaksınız. ( Veri Düzenleyici Refine'inkine benzer bazı işlevlere sahip yeni bir araçtır ve ayrıca kontrol etmeye değer.)
Ayrıca, işletim sisteminizdeki dosyaları ve bunların içindeki verileri yönetmenize yardımcı olabilecek araçlardan haberdar olmalısınız. OSX veya Linux kullanıyorsanız, ama, awk, grep ve bulmak . (Var limanlar Windows için de.) Bu yardımcı programları kullanarak, bir elektronik tablo veya veritabanı programı açma zahmetine bile girmeden verilerinizi keşfetmeye ve masaj yapmaya başlayabilirsiniz.
Ve komut satırı araçlarına bakarken, kontrol edin CSVKit , bu ortak formatta sihir yapmanıza yardımcı olacak - gazeteciler tarafından geliştirilen - harika bir araç takımı.
4. Görselleştirme araçları
Görselleştirme dekorasyon değildir. Bu sadece veri gazeteciliğine eşlik eden ve onu örnekleyen bir şey değildir; görevin merkezindedir. İyi bir görselleştirme, verileri anlamanızı derinden değiştirebilecek şekilde aykırı değerleri ve eğilimleri görmenize olanak tanır.
Çoğu elektronik tablo uygulamasında en azından temel çizelgeler ve grafikler bulunur (ve genellikle eklentiler aracılığıyla daha karmaşık görselleştirmeler sağlanır). Birkaç Web tabanlı görselleştirme aracı standart ücret haline geliyor. Çıkış yapmak Google Füzyon Tabloları ve Genel Kurul . Her ikisi de kullanım kolaylığı ve oldukça etkileyici sonuçlar sunar.
Sonunda, daha esnek ve güçlü bir şey isteyebilirsiniz; uzmanlar genellikle açık kaynak gibi bir şeye yönelir r Güçlü analitik ve görselleştirme araçlarını sağlam bir programlama dilinde birleştiren istatistik paketi.
5. Haritalama yazılımı
Google Fusion tabloları ve Tableau Public, hızlı ve sezgisel eşleme yetenekleri içerir. Haritalarından hiçbiri istediğinizi elde edemediğinde, ücretsiz haritaya göz atın. QGIS haritalama paketi (Ya da haber odanızın yedek lisansı varsa, ArcView güçlü bir ticari seçenektir.) QGIS'e gazeteci merkezli bir giriş için buna göz atın öğretici .
Verileriniz hakkında coğrafi sorular sormanıza yardımcı olabilecek veritabanı yöneticileri için uzamsal uzantılar da vardır. SQL'in yeteneklerini, bir sınır içindeki konumları (ör. ilçe veya kongre bölgesi) belirlemek gibi coğrafya ile ilgili sorguları içerecek şekilde genişletirler. PostGIS ve SpatiaLite ücretsiz ve popüler çözümlerdir.
6. Komut dosyası dili
Bir dil seç, bir kitap al, bir problem çöz. Programlamayı öğrenmek, bir veri gazetecisi olarak erişiminizi hızla genişletecek: Devlet size bir web sitesinin arkasındaki verileri vermeyecek mi? Kazın. Mevcut araçları kullanarak verileri istediğiniz formda almayı başaramıyor musunuz? Kendinizinkini oluşturun. Yalnızca bir yazılım kullanıcısı değil, aynı zamanda bir yazılım üreticisi olmanın baş döndürücü bir gücü vardır.
Hangi dili seçtiğiniz o kadar da önemli değil, ancak piton ve yakut gazeteciler arasında güncel favoriler gibi görünüyor. Tanıdığınız biri zaten birlikte çalışıyorsa Perl veya PHP ve başlamanıza yardımcı olmaya istekliyse, oradan başlamak isteyebilirsiniz. Doğal dillerde olduğu gibi, birini öğrendikten sonra bir sonrakini öğrenmek daha kolaydır ve bir programcı gibi düşünmeyi öğrenmek belirli bir sözdizimini öğrenmekten çok daha önemlidir. (Ayrıca, o anın dilinde yetkin olduğunuzda havalı çocuklar tamamen farklı bir şey kullanıyor olabilirler.)
Web kazıma ile başlamak istiyorsanız, bir göz atın ProPublica'nın mükemmel kazıma kılavuzu . KazıyıcıWiki ayaklarınızı ıslatmanın ve örnek olarak öğrenmenin başka bir yoludur. Programlamayı Öğren Ruby'yi hedef dili olarak kullanan programlama kavramlarına harika bir giriştir.
7. Web çerçevesi
İster kendiniz için araçlar oluşturuyor olun ister dünyaya yönelik uygulamalar oluşturuyor olun, Web için oluşturuyorsanız bir Web çerçevesine ihtiyacınız vardır: django Python için, Ruby için Raylar , senfoni PHP için, katalizör Perl için seçiminizi yapın.
Bir çerçeve sıkıcı, tekrar eden işleri önünüzden kaldıracak, en iyi uygulamaları benimsemenize yardımcı olacak, organize olmanızı sağlayacak ve başkalarıyla işbirliğini kolaylaştıracaktır. Birçok çerçeve, başlarken acının bir kısmını hafifletmeye yardımcı olabilecek tek tıklamalı bir yükleyici ile birlikte gelir. Bitnami'ye bir göz atın django ve yakut örneğin yığınlar.
Bir Web aracı oluşturma sürecinde, yeterli miktarda HTML ve CSS alacaksınız. Ancak tüm işaretler, JavaScript'in tüm Web geliştirmedeki artan önemine işaret ediyor. Web uygulamanızın bir masaüstü uygulaması gibi hissetmesini istiyorsanız, bazı JavaScript'leri, özellikle aşağıdaki gibi kitaplıkları öğrenin. jQuery .
8. Esnek bir düzenleyici
Kod yazmak için bir kod düzenleyiciye ihtiyacınız var. Bu, metninize akıllı, süslü karakterler bırakmayan (size bakarak, Microsoft Word) ve umarız, anahtar kelimeleri ve diğer dili kolayca tanımlamanıza yardımcı olacak dile özgü sözdizimi renklendirme gibi bazı özellikler ekleyen bir düzenleyici anlamına gelir. yazdıkça öğeler.
Bir inek kavgası başlatmanın, hangi kod düzenleyicinin en iyi olduğunu sormaktan daha emin bir yolu yoktur. metin arkadaşı (Mac için) geçerli bir ticari seçenektir. Ve not defteri++ (Windows için) iyi bir ücretsiz seçenektir. Sonsuz özelleştirilebilir açık kaynak seçenekleri de vardır. GELDİM ve Emac'lar . Yine de her biriyle bir öğrenme eğrisine hazır olun. Sonunda, bazı Java programcıları tam bir Entegre geliştirme ortamı . Birisi kodlama öğrenmenize yardımcı oluyorsa, onun düzenleyicisini benimseyin ve yapabileceğiniz her kısayolu ve yapılandırma hilesini öğrenin. Bir editör, araçların en kişiselidir ve kendinizinkini evinizdeymiş gibi hissettirmek isteyeceksiniz.
9. Revizyon kontrolü
Hiç hata yapmaz mısın? Hiç kimseyle işbirliği yapmak istemiyor musun? O zaman belki ihtiyacın yoktur revizyon denetimi . Ancak, yedekleri kaydetmenin, dosyaların geçici sürümlerinde bir şeyler denemenin ve çalışmalarınızı başkalarıyla birleştirmenin zarif bir yolunu istiyorsanız, kullanmaya değer. Revizyon kontrolünü öğrenmenin belki de en kolay yolu kullanmaktır. Github . Ayrıca yükleyebilirsiniz Git veya yıkım yerel olarak.
10. Belge analiz araçları
Veri gazeteciliğinde belki de en heyecan verici sınır, büyük belge kümelerini veri olarak ele alma girişimidir. Belge Bulutu PDF formatının bağlarını gevşetmek için kullanışlı bir arayüz sağlar, belgeler arasında arama yapmaya ve ilgi çekici noktaları çıkarmaya izin verir.
yapboz nispeten büyük bir belge kümesinde gezinmek için yararlı olan masaüstü yazılımıdır. Sonunda, aşağıdaki gibi paketlerin hesaplamalı dilsel potansiyeline bakmak isteyebilirsiniz. Python'un Doğal Dil Araç Kiti ya da Stanford CoreNLP . Ve gazeteciler bu alanın yüzeyini henüz kazıdığı için, yeni araçlar Belgeleri sürekli ortaya çıkan veriler olarak ele alan.
Bu, veri gazeteciliği üzerine iki bölümlük bir dizinin ikinci öyküsü. “Veri gazeteciliğine başlamak için 5 ipucu” başlıklı ilk hikayeyi buradan okuyabilirsiniz.
Bu hikaye aynı zamanda bir Poynter'ın parçasıdır. Hack'ler/Hacker'lar içeren dizi Nasıl Yapılır, gazetecilerin neler öğrenebileceğine odaklanır teknoloji ve yeni araçlarda ortaya çıkan trendlerden.
Düzeltme: Bu hikayenin önceki bir sürümü, kullanıcıların Notepad++ için ödeme yapması gerektiğini belirtti. Aslında, ücretsizdir.