イントロダクション 数ヵ月前、広く成功を収めており、非常に役立つ“10個のシンプルなルール”シリーズの提唱者であるPhil Bourneは、何人かの統計学者に統計に関する10個のシンプルなルールの記事をまとめることを提案 […]

(編注:2016/07/29、いただいたフィードバックをもとに記事を修正いたしました。) 目次: さまざまな勾配降下法 バッチ勾配降下法 確率的勾配降下法 ミニバッチ勾配降下法 課題 勾配降下法を最適化するアルゴリズム […]

ECサイト向けのレコメンデーション・エンジンを構築すると仮定しましょう。 構築する方法としては、コンテンツベースか協調フィルタリングを使用する2つの進め方があります。それぞれのメリットとデメリットを見てみましょう。そして […]

(訳注:2016/7/15、記事を修正いたしました。) 本記事では、世界50カ国におけるソフトウェアエンジニアの年収の中央値と国内の年収の平均値(1人当たりのGDP)を比較します。その方法は、まずlxmlを使ってWebペ […]

次のステップ 統計学とエンジニアリングを統合する方法はたくさんあるので、うまく始められるように幾つかご紹介しましょう。 計測ツール 統計学の基本に焦点を当ててきましたが、そもそも、どうやって関連するデータセットを生成すれ […]

ソフトウェア開発の原点は可能性の追求であり、不可能を可能にすることです。ひとたびソフトウェアが開発されると、エンジニアは次に程度という課題に向き合うことになります。企業向けのソフトウェアであれば、「速度はどれくらいか」と […]

前回の投稿では、言語のword embeddingモデル(WEM)という新しいモデルの概要を説明し、基本的なWEM操作が簡単に実行できるR言語のパッケージを紹介しました。この記事はほとんど、デジタルヒューマニティーズのコ […]

畳み込みニューラルネットワーク(またはConvNet)は、生物学から着想を得た多層パーセプトロン(MLP)の変形です。畳み込みニューラルネットワークには種類の異なる様々な層があり、各層は通常のMLPとは異なる働きをします […]

主観的な観点からPythonとRの比較した記事は山ほどあります。それらに私たちの意見を追加する形でこの記事を書きますが、今回はこの2つの言語をより客観的な目線で見ていきたいと思います。PythonとRを比較をしていき、同 […]

私が神経科学のポスドクからStitch Fixでのデータサイエンスの職に転職することを決意したのは、 collaborative data-driven discoveryといった、サイエンティストとして私が熱望すること […]

データを扱うときに、きちんと定められたワークフローがあると助かります。具体的には、「ストーリーを伝える」(データの可視化/ジャーナリズム)ことだけを目的として分析を行いたいのか、それとも一定のタスク(データマイニング)を […]

この夏、私はカリフォルニア州パロアルトにあるFlipboardでインターンとして仕事をしました。私はそこで機械学習関係の問題に取り組んだのですが、その一つが画像のアップスケーリングでした。この記事では予備的結果を紹介し、 […]