データとデータを併合し、クラスターを形成したい。どのデータとデータをクラスターと認定するかは、データデータ間の距離が小さいもので決めるとする。
ところで、データとデータは距離が計算できるものの、データとクラスター或いはクラスターとクラスター間の距離はどのように定めれば良いか。ここで登場するのが最近隣法や最遠隣法などのクラスター間の距離の決め方である。
大事な点は、最近隣法にしろ最遠隣法にしろこれはあくまで距離の定め方ただそれだけであって、クラスターとして併合するか否かの認定方法は「距離が小さいもの」という基準であることには変わりない。